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Aktenzeichen des Anmelders oder An waits 
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WEITERES siehe Mitteilung uber die Obersendung des internationalen 
VORGEHEN vorlaufigen Prufungsberichts (Formblatt PCT/IPEA/416) 


Internationales Aktenzeichen 
PCT/EP 00/ 05024 


Internationales Anmeldedatum 
( TagjMonatjJahr ) 

31/05/2000 


Prioritatsdatum (TagfMonat/Jahr) 
31/05/1999 


Internationale Patentklassifikation (IPK) oder nationale KJassifikation und IPK 

C12Q1/68 


Anmelder 

MAX-PLANCK-GESELLSCHAFT ZUR F0RDERUNG DER ANGEW. . . 



1. Der internationale vorlaufige Prufung sbericht wurde von der mit der internationalen vorlaufigen Prufung beauftragten 
Behorde erstellt und wird dem Anmelder gemafi Artikel 36 ubermittelt. 



Dieser BERICHT umfaflt insgesamt 

□ 



Blatter einschliefllich dieses Deckblatts. 



Auflerdem liegen dem Bericht AN LAG EN bei; dabei handelt es sich urn Blatter mit Beschreibungen, Anspruchen und/oder 
Zeichnungen, die geandert wurden und diesem Bericht zugrunde liegen, und/oder Blatter mit vor dieser Behorde vorgenom- 
menen Berichtigungen (siehe Regel 70.16 und Abschnitt 607 der Verwaltungsvorsphriften zum PCT) 



Diese Anlagen umfassen insgesamt m 



Blatter. 



3. Dieser Bericht enthalt Angaben und die entsprechenden Seiten zu folgenden Punktcn: 

I [X] Grundlage des Berichts 
II Q Prioritat 

III [X] Keine Erstellung eines Gutachtens uber Neuheit, erfiriderische Tatigkeit und gewerbliche Anwendbarkeit 

IV Mangelnde Einheitlichkeit der Erfindung 

V [X] Begrundete Feststellung nach Artikel 35(2) hinsichtlich der Neuheit, der erfinderischen Tatigkeit und der 

gewerblichen Anwendbarkeit; Unterlagen und Erklarungen zur Stutzung dieser Feststellung 



VI [j^j Bestimmte angefiihrte Unterlagen 
VII Bestimmte Mangel der internationalen Anmeldung 
VIII |^] Bestimmte Bemerkungen zur internationalen Anmeldung 



Datum der Einreichung des Antrags 
22/11/2000 



Name und Postanschrift der mit der internationalen vorlaufigen 
Prufung beauftragten Behorde 

Europaisches Patentamt ^ 
D-80298 Miinchen ^ 
Tel. ( + 49-89) 2399-0, Tx: 523656 epniv d 
Fax: ( + 49-89) 2399-4465 



JEu 
D-; 
Tel 



Datum der Fertigstellung dieses Berichts 
31/05/2002 



Bevollmachtigter Bediensteter 

B0UTRUCHE J E E 

Tel. ( + 49-89) 2399 2828 



Formblatt PCT/IPEA/409 (Deckbl?tt)(Juli 1998) 




INTERNATIONALER VORLAUFIGER Internationales Aktenzeichen PCT/ EP 00/ 05024 
PRUFUNGSBERICHT 



I. Grunciiage des Berichts 

Grundlage dieses Berichtes sind die Anmeldungsunterlagen in der 
ursprunglich eingereichten Fassung. 



III. Keine Erstellung eines Gutachtens uber Neuheit, erfinderische Tatigkeit und 
gewerbliche Anwendbarkeit 

Die Frage, ob die beanspruchte Erfindung als neu, auf erfinderischer Tatigkeit beruhend und 
gewerblich anwendbar anzusehen ist, war nicht Gegenstand einer internationalen vorlaufigen 
Prufung fur die nicht recherchierten Anspruche (Artikel 17(2)(a) oder (3) und Regel 66.1 (e) PCT; 
siehe auch internationaler Recherchenbericht). 



V. Begrundete Feststellung nach Regel 66.2(a)(ii) hinsichtlich der Neuheit, der 
erfinderischen Tatigkeit und der gewerblichen Anwendbarkeit 

Soweit die internationaler vorlaufige Prufung durchgefuhrt wurde (s. Punkt III oben), ist 
folgendes anzumerken: 

In Anbetracht der im internationalen Recherchenbericht angefuhrten Unterlagen wird 
festgestellt, daB die Erfindung, wie sie in mindestens einem der unabhangigen Anspruche 
gekennzeichnet ist, die in Artikel 33(1) PCT aufgefuhrten Kriterien allem Anschein 
nach nicht erfulit, d.h. nicht als neu und/oder auf erfinderischer Tatigkeit beruhend 
anzusehen ist (siehe internationaler Recherchenbericht, insbesondere die mit X und/oder Y 
angefuhrten Unterlagen und die entsprechenden Anspruchsnummern). 



Formblatt PCT/409ND2 (EPA-03-2002) P20756 



VERTRAG UBER DIE INTERNATIONALE ZUSA!MIM]_, 
AUF DEM GEBOET DES PATENTWESENS 

POT 

INTERNATIONALER RECHERCHENBERICHT 

(Artikel 1 8 sowie Regeln 43 und 44 PCT) 



siehe Mitteilung uberdie Ubermittlun^ des internationalen 
Recherchenberichts (Formblatt PCT/ISA/220) sowie, soweit 
zutreffend, nachstehender Punkt 5 



Aktenzeichen des Anmelders Oder Anwalts 



WEITERES 
VORGEHEN 



Internationales Aktenzeichen 

PCT/EP 00/05024 



Internationales Anmeldedatum 
(Tag/Monat/Jahr) 

31/05/2000 



(Fruhestes) Prioritatsdatum (Tag/Monat/Jahr) 
31/05/1999 



Anmelder 



MAX-PLANCK-GESELLSCHAFT ZUR FoRDERUNG DER ANGEW. . 



Dieser internationale Recherchenbericht wurde von der Internationalen Recherchenbehorde erstellt und wird dem Anmelder gemaB 
Artikel 1 8 ubermittelt. Eine Kopie wird dem Internationalen Buro ubermittelt. 
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. Blatter. 



Dieser internationale Recherchenbericht umfaGt insgesamt. 

I I Daruber hinaus liegt ihm jeweils eine Kopie der in diesem Bericht genannten Unterlagen zum Stand der Technik bei. 



1 . Grundlage des Berichts 

a. Hinsichtlich der Sprache ist die internationale Recherche auf der Grundlage der internationalen Anmeidung in der Sprache 
durchgefuhrt worden, in der sie eingereicht wurde, sofern unter diesem Punkt nichts anderes angegeben ist. 

| [ Die internationale Recherche ist auf der Grundlage einer bei der Behorde eingereichten Gbersetzung der internationalen 
Anmeidung (Regel 23.1 b)) durchgefuhrt worden. 

b. Hinsichtlich der in der internationalen Anmeidung offenbarten Nucleotid- und/oder Aminosauresequenz ist die internationale 
Recherche auf der Grundlage des Sequenzprotokolls durchgefuhrt worden, das 

f~X~| in der internationalen Anmeidung in Schriflicher Form enthalten ist. 

| [ zusammen mit der internationalen Anmeidung in computerlesbarer Form eingereicht worden ist. 
bei der Behorde nachtraglich in schriftlicher Form eingereicht worden ist. 
bei der Behorde nachtraglich in computerlesbarer Form eingereicht worden ist. 

Die Erkiarung, daG das nachtraglich eingereichte schriftliche Sequenzprotokoll nicht uber den Offenbarungsgehalt der 
internationalen Anmeidung im Anmeldezeitpunkt hinausgeht, wurde vorgelegt. 

I | Die Erkiarung, daG die in computerlesbarer Form erfaBten Informationen dem schriftlichen Sequenzprotokoll entsprechen 
wurde vorgelegt. 



n 



2. 
3. 



5. 



6. 



|~X~| Bestimmte Anspruche haben sich als nicht recherchierbar erwiesen (siehe Feld I). 
[X] Mangefnde Einheitlichkeit der Erfindung (siehe Feld II). 

Hinsichtlich der Bezeichnung der Erfindung 

| | wird der vom Anmelder eingereichte Worttaut genehmigt. 

[X] wurde der Wortlaut von der Behorde wie folgt festgesetzt: 
ESSENTIELLE GENE UND GENPRODUKTE ZUR IDENTIFIZIERUNG, ENT WICK LUNG UND 
OPTIMIERUNG VON IMMUNOLOGI SCHEN UND PHARMAKOLOGI SCHEN WIRKSTOFFEN ZUR 

BEHANDLUNG MIKROBIELLER INFEKTIONEN 
Hinsichtlich der Zusammenfassung 

|^"[ wird der vom Anmelder eingereichte Wortlaut genehmigt. 

— wurde der Wortlaut nach Regel 38.2b) in der in Feld III angegebenen Fassung von der Behorde festgesetzt. Der 

| | Anmelder kann der Behorde innerhalb eines Monats nach dem Datum der Absendung dieses internationalen 

Recherchenberichts eine Steilungnahme vorlegen. 

Folgende Abbildung der Zeichnungen ist mit der Zusammenfassung zu veroffentlichen: Abb. Nr. \ 

| | wie vom Anmeider vorgeschlagen Q^j keine der Abb 

[~X] weil der Anmelder selbst keine Abbildung vorgeschlagen hat. 

| | weil diese Abbildung die Erfindung besser kennzeichnet. 



Formblatt PCT/ISA/210 (Blatt 1) (Juli 1998) 



INTERNATIONALER RECHERCHENBERICHT 



Internationales Aktenzeichen 

PCT/EP 00/05024 



Feld I Bemerkungen zu den Anspruchen, die sich als nicht recherchierbar erwiesen haben (Fortsetzung von Punkt 2 auf Blatt 1) 



GemaB Artikel 17(2)a) wurde aus folgenden Grunden fur bestimmte Anspruche kein Recherchenbericht erstellt: 
1 - | | Anspruche Nr. 

weil sie sich auf Gegenstande beziehen, zu deren Recherche die Behdrde nicht verpflichtet ist, namlich 



E 



Anspruche Nr. 



weil sie sich auf Teile der internationalen Anmeldung beziehen, die den vorgeschriebenen Anforderungen so weniq entsorechen 
daR erne sinnvolle Internationale Recherche nicht durchgefuhrt werden kann, namlich enrsprecnen, 

siehe Zusatzblatt WEITERE ANGABEN PCT/ISA/210 



3. | | Anspruche Nr. 

weil es sich dabei um abhangrge Anspruche handelt, die nicht entsprechend Satz 2 und 3 der Regel 6.4 a) abgefaBt sind. 

Feld II Bemerkungen bei mangelnder Einheitlichkeit der Erfindung (Fortsetzung von Punkt 3 auf Blatt 1 ) 
Die Internationale Recherchenbehorde hat festgestellt, daB diese internationale Anmeldung mehrere Erfindungen enthalt: 

siehe Zusatzblatt 



1 . [~~| Da der Anmelder alle erforderlichen zusatzlichen Recherchengebuhren rechtzeitig entrichtet hat, erstreckt sich dieser 
' ' Internationale Recherchenbericht auf alle recherchierbaren Anspruche. uieser 

2 . Q Da fur alle recherchierbaren Anspruche die Recherche ohne einen Arbeitsaufwand durchgefuhrt werden konnte der eine 
' zusatzhche Recherchengebuhr gerechtfertigt hatte, hat die Behorde nicht zur Zahlung einer solchen Gebuhr aufbe^dert. 



3. Q Da der Anmelder nur einige der erforderlichen zusatzlichen Recherchengebuhren rechtzeitig entrichtet hat, erstreckt sich dieser 

1 1 Internationale Recherchenbericht nur auf die Anspruche, fur die Gebuhren entrichtet worden sind, namlich auf die 

Anspruche Nr. 



*■ Q S^!2S^l r Jl^lS™S^^ e J^ hM 2 f u ? §tzlic '? en Recherchengebuhren nicht rechtzeitig entrichtet. Der internationale Recher- 
chenbericht beschrankt sich daher auf die in den Anspruchen zuerst erwahnte Erfindung; diese ist in folgenden Anspruchen er- 

Siehe 'Weitere Angaben', Subjekt 1. 



Bemerkungen hinsichtlich eines Widerspruchs Q Die zusatzlichen Gebuhren wurden vom Anmelder unter Widerspruch gezahlt. 

| | Die Zahlung zusatzlicher Recherchengebuhren erfolgte ohne Widerspruch. 



Formblatt PCT/ISA/210 (Fortsetzung von Blatt 1 (1))(Juli 1998) 



Internationales AktenzeichenPCT/EP 00/05024 

WEITERE ANGABEN PCT/ISA/ 210 



Fortsetzung von Feld 1.2 



Die geltenden Patentanspruche 34-36,38-44,48-57 beziehen sich auf 
Produkte, jeweils charakteri siert durch eine erstrebenswerte Eigenheit 
oder Eigenschaft, namlich spezifische Wirkstoffe die Inakti vierung der 
verwendeten Mi kroorganismen herbeifuhren und gerichtet sind gegen die 
essentiellem Gen-oder Genprodukten die mit diesen Verfahren identifiziert 
werden konnen. 

Die Patentanspruche umfassen daher alle Produkte etc., die diese 
Eigenheit oder Eigenschaft aufweisen, wohingegen die Patentanmeldung 
Stutze durch die Beschreibung im Sinne von Art. 5 PCT nur ftir eine 
begrenzte Zahl solcher Produkte etc. liefert. Im vorliegenden Fall fehlen 
den Patentanspriichen die entsprechende Stutze bzw. der Patentanmeldung 
die notige Offenbarung in einem solchen MaBe, daB eine sinnvolle 
Recherche uber den gesamten erstrebten Schutzbereich unmoglich 
erscheint. Desungeachtet fehlt den Patentanspriichen auch die in Art. 6 
PCT geforderte Klarheit, nachdem in ihnen versucht wird, die Produkte 
uber das jeweils erstrebte Ergebnis zu definieren. Auch dieser Mangel an 
Klarheit ist dergestalt, daB er eine sinnvolle Recherche uber den 
gesamten erstrebten Schutzbereich unmoglich macht. Daher wurde die 
Recherche auf die Teile der Patentanspruche gerichtet, welche im o.a. 
Sinne als klar, gestutzt oder offenbart erscheinen, namlich die Teile 
betreffend die Produkte mit SEQ ID NOs: 1-246, oder antisense (Beispiel 
• 

Der Anmelder wird darauf hingewiesen, daB Patentanspruche, oder Teile von 
Patentanspriichen, auf Erfindungen, fur die kein internationaler 
Recherchenberi cht erstellt wurde, normal erweise nicht Gegenstand einer 
international en vorlaufigen Prufung sein konnen (Regel 66.1(e) PCT). In 
seiner Eigenschaft als mit der international en vorlaufigen Prufung 
beauftragte Behbrde wird das EPA also in der Regel keine vorlaufige 
Prufung fur Gegenstande durchfuhren, zu denen keine Recherche vorliegt 
Dies gilt auch fur den Fall, daB die Patentanspruche nach Erhalt des 
international en Recherchenberi chtes geandert wurden (Art. 19 PCT), oder 
fur den Fall, daB der Anmelder im Zuge des Verfahrens gemaB Kapitel II 
PCT neue Patentanspruche vorlegt. 



AUFFORDERUNG ZUR ZAHLUNG ZUSAT2LICHER GEBUHREN 



interric^iKJes AKtenzeichen 
PCT/EP 00/05024 



Die international Recherchenbehorde hat festgestel It , daB diese 
internationale Anmeldung mehrere (Gruppen von) Erfindungen enthalt, 
naml ich: 

1. Anspruche: 1,4-23,29-40,42-57, (alle teilweise) 2,27, 
28 (vollstandig) 



Erfindung 1: 

Verfahren fur die Bestimmung von Gene die Lebens- oder/und 
Uberlebungsfahigkelt von einem Mikroorganismus bestimmen 
durch konditionale Antisense-Hemmung (CAI), deren 
Genprodukte, Antikorper dagegen, Genbanken, Vektoren, 
Zellen, Mutantenbanken die davon abgeleitet sind, 
Pharmazeutische Zusammensetzung damit, und Verfahren und 
Verwendungen die diese benutzen. 

2. Anspruche: 1,4-23,29-39,41-57, (alle teilweise) 3,26, 
58 (alle vollstandig) 



Erfindung 2: 

Verfahren fur die Bestimmung von Gene die Lebens- oder/und 
Uberlebungsfahigkelt von einem Mikroorganismus bestimmen 
durch subtraktive Rekombinations-Mutagenese (SRM), deren 
Genprodukte, Antikorper dagegen, Genbanken, Vektoren, 
Zellen, Mutantenbanken die davon abgeleitet sind, 
Pharmazeutische Zusammensetzung damit, und Verfahren und 
Verwendungen die diese benutzen. 



3. Anspruche: 22,23,29-39,42-57, 

(alle teilweise) 24 (vollstandig) 



Erfindung 3: 

Verfahren fur die Bestimmung von Gene die Lebens- oder/und 
Uberlebungsfahigkeit von einem Mikroorganismus bestimmen 
durch Transposon-Mutagenese, deren Genprodukte, Antikorper 
dagegen, Genbanken, Vektoren, Zellen, Mutantenbanken die 
davon abgeleitet sind, Pharmazeutische Zusammensetzung 
damit, und Verfahren und Verwendungen die diese benutzen. 



4. Anspruche: 22,23,29-39,42-57, 

(alle teilweise) 25 (vollstandig) 



Erfindung 4: 
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Internl^Kles Aktenzeichen 
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Verfahren fur die Bestimmung von Gene die Lebens- oder/und 
Uberlebungsfahigkeit von einem Mikroorganismus bestimmen 
durch homologe Rekombi nation, deren Genprodukte, Antikorper 
dagegen, Genbanken, Vektoren, Zellen, Mutantenbanken die 
davon abgeleitet sind, Pharmazeutische Zusammensetzung 
damit, und Verfahren und Verwendungen die diese benutzen. 



5. Anspruche: 1,4-23,29-39,42-57 (alle teilweise) 2, 
27 (vollstandig) 



Erflndung 5: 

Verfahren fur die Bestimmung von Gene die Lebens- oder/und 
Uberlebungsfahigkeit von einem Mikroorganismus bestimmen 
durch Antlsense-Hemmung, deren Genprodukte, Antikorper 
dagegen, Genbanken, Vektoren, Zellen, Mutantenbanken die 
davon abgeleitet sind, Pharmazeutische Zusammensetzung 
damit, und Verfahren und Verwendungen die diese benutzen. 



6. Anspruche: 1,4-23,29-57 (alle teilweise) 

Erflndung 6: 

Nuklelnsaure mit SEQ ID N0:1, dessen Polypeptld mit SEQ ID 
NO: 2, Antikorper dagegen, Genbanken, Vektoren, Zellen, 
Mutantenbanken die davon abgeleitet sind, Pharmazeutische 
Zusammensetzung damit, und Verfahren und Verwendungen die 
diese benutzen fur die Bestimmung von Gene die Lebens- 
oder/und Uberlebungsfahigkeit von einem Mikroorganismus 
bestimmen. 

7. Anspruche: 1,4-23,29-57 (alle teilweise) 

Erfindung 7: 

Nuklelnsaure m1t SEQ ID N0:3, dessen Polypeptid m1t SEQ ID 
NO: 4, Antikorper dagegen, Genbanken, Vektoren, Zellen, 
Mutantenbanken die davon abgeleitet sind, Pharmazeutische 
Zusammensetzung damit, und Verfahren und Verwendungen die 
diese benutzen fur die Bestimmung von Gene die Lebens- 
oder/und Uberlebungsfahigkeit von einem Mikroorganismus 
bestimmen. 

Erfindung 8-128: 

Ebenso fur die Erfindungen 8-128 aber beschrankt auf die SEQ 
ID NO:5-246 wobei Erflndung 8 ubereinstimmt mit SEQ ID 
N0:5,6; Erfindung 128 ubereinstimmt mit SEQ ID 

NO: 245,246. 
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1. Verfahren, Gene, und Genprodukte die Lebens- oder/und 
Uberlebungsfahigkelt von einem Mikroorganismus bestimmen, sind bekannt 
aus der Fachl iteratur und gehoren zum Stand der Technik. US5527678 (Dl) 
W09719098 (D2), XP002178303 (D3), US5639595 (D4), US5217889 (D5) 
XP002178304 (D6), W09820161 (D7), EP0174096 (D8), US5434065 (D9) ' 
EP0837142 (D10), XP002178305 (Dll), US5821076 (D12), W09843478 (D13) 
W09821225 (D14), XP002062106 (D15), und XP000645478 (D16) 
beschreiben Verfahren die Gene und Genprodukte die Lebens- oder/und 
Uberlebungsfahigkelt von einem Mikroorganismus bestimmen identif izieren 
und verwenden. 

2. Im Hinblick auf die Fachl iteratur kann das Problem dieser Anmeldung 
definiert werden als die Bereitstel lung von alternativen Verfahren, 
Nukleinsauren, und Polypeptiden fur die Bestimmung von Gene die Lebens- 
oder/und Uberlebungsfahigkelt bestimmen. 

Die alternativen Verfahren umfassen konditionale Antisense-Hemmung, 
subtraktlve Rekombinations-Mutagenese, Transposon-Mutagenese, homologe 
Rekombi nation, und Antisense-Hemmung. Die alternativen Nukleinsauren und 
Polypeptiden Gleichen die Erfindungen 6-128: wobei Erfindung 6 
ubereinstimmt mit SEQ ID N0:l,2; Erfindung 8 ubereinstimmt mit SEQ 

ID N0:5,6; Erfindung 128 ubereinstimmt mit SEQ ID N0:245,246. 

3. Da Verfahren, Nukleinsauren und Polypeptiden fur die Bestimmung von 
Gene die Lebens- oder/und Uberlebungsfahigkelt bestimmen bereits aus der 
Fachl iteratur bekannt sind, durch die wesentlichen Unterschiede 1n der 
Primarer Struktur und Blndungsspezif izltat zwischen den Nukleinsauren 
und Polypeptiden, und 1m Hinblick auf das Fehlen von technischen 
Merkmalen die unter Berucksichtigung des Stands der Technik als 
besondere technischen Merkmale gesehen werden konnen, die einen 
Zusammenhang zwischen den Losungen darstellen, ist die IRB der Meinung 
das zwischen den 128 Losungen kein gemelnsames erf inderisches Konzept 
gemaB Regel 13.1 PCT vorliegt. Deshalb ist das Erfordernls der 
Einheitlichkelt nlcht erfullt, und die verschledenen Erfindungen, die 
nicht durch eine gemelnsame erf inderlsche Idee verbunden sind, werden im 
Bescheid gemaB Art. 17(3)(a) PCT aufgefuhrt. 

Die ersten sechs Erfindungen sind gesucht worden da dies ohne 
unangemessenen Zeitaufwand passieren konnte. 



Intern^Pfiales Aktenzeichen 
PCT/EP 00/05024 
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INTERNAtlONALER RECHERCHENBERICHT 



Internationales Aktenzeichen 

PCT/EP 00/05024 



A. KLASSIFIZIERUNG DES ANMELDUNGSGEGENSTANDES 

IPK 7 C12Q1/68 G01N33/48 C07K14/205 C12N15/63 

C12N1/21 A61K31/7088 A61K35/12 A61K38/16 

A61P31/04 A61K39/106 A61K48/00 C12N15/11 

Nach der Internationalen Patentklassifikation (IPK) oder nach der nationalen Klassifikation und der IPK 

B. RECHERCHIERTE GEBIETE 

Recherchierter Mindestprufstoff (Klassifikationssystem und Klassifikationssymbole ) 

IPK 7 C12Q C12N C07K 



C07K16/12 
A61K39/40 
C12N15/90 



Recherchierte aber nicht zum Mindestprufstoff gehfirende Verflffentlichungen, soweit diese unterdie recherchierten Gebiete fallen 



Wahrend der internationalen Recherche konsultierte elektronische Datenbank (Name der Datenbank und evtl. verwendete Suchbegriffe) 

EPO-Internal, WPI Data, PAJ, CHEM ABS Data, MEDLINE, EMBASE, BIOSIS 



C. ALS WESENTLICH ANGESEHENE UNTERLAGEN 



Kategorie 0 


Bezeichnung der Veroffentlichung, soweit erforderiich unter Angabe der in Betracht kommenden Teile 


Betr. Anspruch Nr. 


X 


US 5 527 678 A (BLASER MARTIN J ET AL) 


1,2,4-6, 




18. Juni 1996 (1996-06-18) 


9,12-23, 






25,27, 






29, 






33-35, 






38-44, 






48-57 




Spalte 3, Zeile 1-60; Bei spiel 2; Tabelle 
1 




X 


WO 97 19098 A (ASTRA AB ; SMITH DOUGLAS H 


1,3-23, 




(US)) 29. Mai 1997 (1997-05-29) 


27, 






29-36, 






38-40, 






42-44, 






48-57 




Seite 45, Zeile 20 -Seite 71, Zeile 29 






-/- 





0 



Weitere Veroffentlichungen sind der Fortsetzung von Feld C zu 
entnehmen 



Siehe Anhang Patentfamilie 



° Besondere Kategorien von angegebenen Ver8ffentlichungen : 
TV* Veroffentlichung, die den allgemeinen Stand derTechnikdefiniert, 
aber nicht als besonders bedeutsam anzusehen ist 

"E" alteres Dokument, das jedoch erst am oder nach dem internationalen 
Anmeldedatum ver6ffentlicht worden ist 



Veroffentlichung, die geeignet ist, einen Prioritatsanspruch zweifelhaft er- 
scheinen zu las sen, oder durch die das VerOffentlichungsdatum einer 
anderen im Recherchenbericht genannten Veroffentlichung belegt werden 
soil oder die aus einem anderen besonderen Grund angegeben ist (wie 
ausgefuhrt) 

Ver6ffentlichung, die sich auf eine mundliche Offenbarung, 
eine Benutzung, eine Ausstellung oder andere MaBnahmen bezieht 

Veroffentlichung, die vordem internationalen Anmeldedatum, aber nach 
dem beanspruchten Prioritatsdatum verOffentlicht worden ist 



T" Spatere Veroffentlichung, die nach dem internationalen Anmeldedatum 
oder dem Prioritatsdatum verOffentlicht worden ist und mit der 
Anmeldung nicht koJIidiert, sondern nur zum Verstandnis des der 
Erfindung zugrundeliegenden Prinzips oder der ihr zugrundeliegenden 
Theorie angegeben ist 

"X" VerOffentlichung von besonderer Bedeutung; die beanspruchte Erfindung 
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(57) Abstract: The invention relates to 
methods for preparing therapeutic, preventative 
and/or diagnostic agents Tor treating microbial 
infections and to methods for identifying 
and characterising essential genes from 
Helicobacter pylori. The invention also relates 
to the identified nucleic acids which code for the 
essential gene products and to the polypeptides 
which are coded therefrom. 
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essenliellcn Genprodukle kodieren, und die 
davon kodicrlen Polypeptide. 
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INTERNATIONAL SEARCH REPORT 



International application No. 

PCT/EP 00/05024 



Box I Observations where certain claims were found unsearchable (Continuation of item 1 of first sheet) 

This international search report has not been established inrespect of certain claims under Article 1 7 (2)(a) for the following reasons : 
1 . f I Claims Nos . : 

' ' because they relate to subject matter not required to be searched by this Authority, namely: 



2. j)( Claims Nos.: 

because they relate to parts of the international application that do not comply with the prescribed requirements to such 
an extent that no meaningful international search can be carried out, specifically: 

See supplemental sheet FURTHER INFORMATION PCT/ISA/210. 

3 . I I Claims Nos . : 

' 1 because they are dependent claims and are not drafted in accordance with the second and third sentences of Rule 6.4(a). 

Box II Observations where unity of invention is lacking (Continuation of item 2 of first sheet) 

This International Searching Authority found multiple inventions in this international application, as follows: 

See supplemental sheet. 



1 . I I As all required additional search fees were timely paid by the applicant, this international search report covers all 

searchable claims. 

2 . [ | As all searchable claims could be searched without effort justifying an additional fee, this Authority did not invite payment 

of any additional fee. 

3. ( I As only some of the required additional search fees were timely paid by the applicant, this international search report 
covers only those claims for which fees were paid, specifically claims Nos.: 



4. I v| No required additional search fees were timely paid by the applicant. Consequently, this international search report is 
' restricted to the invention first mentioned in the claims; it is covered by claims Nos.: 

See FURTHER INFORMATION, subject 1 . 

Remark on Protest | | The additional search fees were accompanied by the applicant ' s protest. 

| | No protest accompanied the payment of additional search fees. 
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FURTHER INFORMATION PCT/ISA/210 

The International Searching Authority found that this International Application contains 
several inventions or groups of inventions, as follows: 

1 . Claims nos: 1 , 4-23 5 29-40, 42-57 (all in part), 2, 27, 28 (in full) 

Invention 1 : 

Method for determining genes, which determine the viability or survival capacity 
of a micro-organism by conditional antisense inhibition (CAI), gene products of 
said genes, antibodies against said genes and products, gene banks, vectors, cells, 
mutant banks that are derived therefrom, pharmaceutical composition made 
therewith and methods and uses that utilise the same. 

2. Claims nos: 1, 4-23, 29-39, 41-57 (all in part) 3, 26, 58 (all in full) 

Invention 2 

Method for determining genes, which determine the viability or survival capacity 
of a micro-organism by subtractive recombination mutagenesis (SRM), gene 
products of said genes, antibodies against said genes and products, gene banks, 
vectors, cells, mutant banks that are derived therefrom, pharmaceutical 
composition made therewith and methods and uses that utilise the same. 

3. Claims nos: 22, 23, 29-39, 42-57 (all in part), 24 (in fiill) 

Invention 3 

Method for determining genes, which determine the viability or survival capacity 
of a micro-organism by transposon mutagenesis, gene products of said genes, 
antibodies against said genes and products, gene banks, vectors, cells, mutant 
banks that are derived therefrom, pharmaceutical composition made therewith and 
methods and uses that utilise the same. 

4. Claims nos: 22, 23, 29-39, 42-57 (all in part), 25 (in full) 

Invention 4 

Method for determining genes, which determine the viability or survival capacity 
of a micro-organism by homologous recombination, gene products of said genes, 
antibodies against said genes and products, gene banks, vectors, cells, mutant 
banks that are derived therefrom, pharmaceutical composition made therewith and 
methods and uses that utilise the same. 

5. Claims nos: 1, 4-23, 29-39, 42-57 (all in part), 2, 27 (in full) 

Invention 5 
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Method for determining genes, which determine the viability or survival capacity 
of a micro-organism by antisense inhibition, gene products of said genes, 
antibodies against said genes and products, gene banks, vectors, cells, mutant 
banks that are derived therefrom, pharmaceutical composition made therewith and 
methods and uses that utilise the same. 

6. Claims nos: 1, 4-23, 29-57 (all in part) 

Invention 6 

Nucleic acid with SEQ ID NO:l; polypeptide thereof with SEQ ID NO:2, 
antibodies against the aforementioned nucleic acid and polypeptide, gene banks, 
vectors, cells, mutant banks derived therefrom, pharmaceutical composition made 
therewith and methods and uses that utilise the same for determining genes, which 
determine the viability or survival capacity of a micro-organism. 

7. Claims nos: 1, 4-23, 29-57 (all in part) 

Invention 7 

Nucleic acid with SEQ ID NO:3; polypeptide thereof with SEQ ID NO:4, 
antibodies against the aforementioned nucleic acid and polypeptide, gene banks, 
vectors, cells, mutant banks derived therefrom, pharmaceutical composition made 
therewith and methods and uses that utilise the same for determining genes, which 
determine the viability or survival capacity of a micro-organism. 

Invention 8-128 

Likewise for inventions 8-128, but limited to SEQ ID NOS:5-246, whereby 
invention no. 8 corresponds with SEQ ID NOS:5, 6;.. .; invention no. 128 
corresponds with SEQ ID NOS:245, 246. 
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FURTHER INFORMATION PCT/ISA/210 
Continuation of field 1.2 

The relevant patent claims nos. 34-36, 38-44, 48-57 relate to products, each characterised by a 
desirable peculiarity or property, namely specific active ingredients, which cause the micro- 
organisms used to be deactivated and are directed against the essential genes or gene products 
that can be identified using said method. 

The patent claims therefore cover all products etc. having the aforementioned peculiarity or 
property, of which only a small portion is supported by the patent application in the 
description according to the terms of PCT Article 5. In the present case, the patent claims lack 
the appropriate support and the patent application lacks the required disclosure to such an 
extent that a meaningful search encompassing the entire scope of protection sought seems 
impossible. Aside from this, the patent claims also lack clarity under the terms of PCT Article 
6, in attempting to define the products by the result that is sought in each case. This absence 
of clarity is also such that it makes it impossible to conduct a meaningful and complete search 
encompassing the entire scope of protection sought. The search therefore focussed on parts of 
the patent claims that seemed to be clear, supported or disclosed according to the 
aforementioned terms, namely the parts relating to the products with SEQ ID Nos: 1-246, or 
to antisense, (example 2). 

The applicant is therefore advised that patent claims, or sections of patent claims relating to 
inventions for which no international search report was drafted, cannot normally be the 
subject of an international preliminary examination (PCT Rule 66. 1(e)). EPO policy, when 
acting as an International Preliminary Examining Authority, is normally not to carry out a 
preliminary examination of subject matter, for which no search has been conducted. This is 
also the case, irrespective of whether the claims are amended following receipt of the 
international search report (PCT Article 19) or during any PCT Chapter II procedure whereby 
the applicant submits new patent claims. 
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From the INTERNATIONAL BUREAU 



PCT 

NOTIFICATION OF THE RECORDING 
OF A CHANGE 

(PCT Rule 92bis.1 and 
Administrative Instructions, Section 422) 


To: 

WEICKMANN, H. ^^^^^S£^^ 
Weickmann & Weickniajjn ■ vC ^^sg| ff 
Kopernikusstrasse 9 / fc 1 9 AfP7 f 
D-81679Munchen / " **** tuQj f 
ALLEMAGNE / 5** / 


Date of mailing (day/month/year) 
09 March 2001 (09.03.01) 


Applicant's or agent 1 s file reference 


IMPORTANT NOTIFICATION 


International application No. 
PCT/EP00/05024 


International filing date (day/month/year) 
31 May 2000 (31.05.00) 



1. The following indications appeared on record concerning: 

X the applicant | | the inventor | | the agent | | the common representative 


Name and Address 

CREATOGEN GMBH 
Ulmer Strasse 160a 
D-86156 Augsburg 
Germany 


State of Nationality 
DE 


State of Residence 
DE 


Telephone No. 


Facsimile No. 


Teleprinter No. 


2. The International Bureau hereby notifies the applicant that the following change has been recorded concerning: 
| | the person | X| the name | | the address | | the nationality | | the residence 


Name and Address 

CREATOGEN AKTIENGESELLSCHAFT 
Ulmer Strasse 160a 
D-86156 Augsburg 
Germany 


State of Nationality 
DE 


State of Residence 
DE 


Telephone No. 


Facsimile No. 


Teleprinter No. 


3- Further observations, if necessary: 


4. A copy of this notification has been sent to: 
| X| the receiving Office | | the designated Offices concerned 
| | the International Searching Authority | X| the elected Offices concerned 
[ X| the International Preliminary Examining Authority | | other: 





The International Bureau of WIPO 
34, chemin des Colombettes 
1211 Geneva 20, Switzerland 

Facsimile No.: (41-22) 740.14.35 


Authorized officer * 

A. Karkachi / 

s* 

Telephone No.: (41-22) 338.83.38 
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From the INTERNATIONAL BUREAU 



PCT 

NOTIFICATION OF TRANSMITTAL 
OF COPIES OF TRANSLATION 
OF THE INTERNATIONAL PRELIMINARY 
EXAMINATION REPORT 

(PCT Rule 72.2) 


To: 

WEICKMANN, H. 
Weickmann & Weickmann 
Kopernikusstrasse 9 
D-81679 Munchen 
Germany 


Date of mailing (day/month/year) 

13 November 2002 (13.11.02) 


Applicant's or agent's file reference 


IMPORTANT NOTIFICATION 


International application No. 
PCT/EP00/05024 


International filing date (day/month/year) 
31 May 2000(31.05.00) 


Applicant MA x-PLANCK-GESELLSCHAFT ZUR FORDERUNG DER WISSENSCHAFTEN E.V. et 
al 



1. Transmittal of the translation to the applicant. 

The International Bureau transmits herewith a copy of the English translation made by the 
International Bureau of the international preliminary examination report established by the 
International Preliminary Examining Authority. 



2. Transmittal of the copy of the translation to the elected Offices. 

The International Bureau notifies the applicant that copies of that translation have been 
transmitted to the following elected Offices requiring such translation: 

CA,CN,JP,KP,KR,US 



The following elected Offices, having waived the requirement for such a transmittal at this time, 
will receive copies of that translation from the International Bureau only upon their request: 

AP^A^^AE^CAUAM^AU^BA^B^CBR^Y^H^R^U^^D^D^DM^Z^E^S^I^B, 

■GD^E^GH^GM^HR^UJDJLJNJS^E^G^KZ^LC^K^R^LS^LT^U^V^A^D^G^M^MN^W^X, 

MZ,NO,NZ,PL,PT,RO,RU,SD,SE,SG,SI,SK,SL,TJ,TM,TR,^^ 



3. Reminder regarding translation into (one of) the official language(s) of the elected Office(s). 

The applicant is reminded that, where a translation of the international application must be 
furnished to an elected Office, that translation must contain a translation of any annexes to the 
international preliminary examination report. 

It is the applicant's responsibility to prepare and furnish such translation directly to each elected 
Office concerned (Rule 74.1). See Volume II of the PCT Applicant's Guide for further details. 





Authorized officer 


The International Bureau of WIPO 




34, chemin des Colombettes 


Bernard THORAX 


121 1 Geneva 20, Switzerland 




Facsimile No. (41-22) 740.14.35 


Telephone No. (41-22) 338.83.38 
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Copy forth Elected Office (EO/US) 
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From the INTERNATIONAL BUREAU 



PCT 

NOTIFICATION OF THE RECORDING 
OF A CHANGE 

(PCT Rule 92bis.1 and 
Administrative Instructions, Section 422) 


To: 

WEICKMANN, H. 
Weickmann & Weickmann 
Kopernikusstrasse 9 
D-81679 Munchen 
ALLEMAGNE 


Liaic ut mailing ^udy/iTioriiri/year/ 

04 January 2001 (04.01.01) 


Applicant's or agent's file reference 


IMPORTANT NOTIFICATION 

• r 


International application No. 
PCT/EP00/05024 


International filing date (day/month/year) 
31 May 2000(31.05.00) 





1. The following indications appeared on record concerning: 
| | the applicant | | the inventor 


X the agent | [ the common representative 



WEICKMANN, H. 
Kopernikusstrasse 9 
D-81679 Munchen 
Germany 



Telephone No. 
089/ 455 63-0 



Facsimile No. 

089/ 455 63-999 



Teleprinter No. 



2. The International Bureau hereby notifies the applicant that the following change has been recorded concerning: 

| | the nationality | | the residence 



□ 



the person 



□ 



the name 



the address 



Name and Address 

WEICKMANN, H. 
Weickmann & Weickmann 
Kopernikusstrasse 9 
D-81679 Munchen 
Germany 



State of Nationality 



State of Residence 



Telephone No. 
089/ 455 63-0 



Facsimile No. 

089/ 455 63-999 



Teleprinter No. 



3. Further observations, if necessary: 

The agent's new address on the Demand has been considered as a change under Rule 92bis. In 
case of disagreement, the International Bureau should be notified immediately. 



4. A copy of this notification has been sent to: 
[ X | the receiving Office 
| | the International Searching Authority 
| X| the International Preliminary Examining Authority 



[ | the designated Offices concerned 
| X | the elected Offices concerned 

□ 



other: 





Authorized officer 


The International Bureau of WIPO 


34, chemin des Colombettes 


A. Karkachi 


1211 Geneva 20, Switzerland 




Facsimile No.: (41-22) 740.14.35 


Telephone No.: (41-22) 338.83.38 


Form PCT/I8/306 (March 1994) 
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From the INTERNATIONAL BUREAU 



PCT 

NOTIFICATION OF ELECTION 
(PCT Rule 61.2) 


To: 

Commissioner 

US Department of Commerce 
United States Patent and Trademark 
Office, PCT 

201 1 South Clark Place Room 
CP2/5C24 

Arlington, VA 22202 
ETATS-UNIS D'AMERIQUE 

in its capacity as elected Office 


Date of mailing (day/month/year) 
04 January 2001 (04.01.01) 




International application No. 
PCT/EP00/05024 


Applicant's or agent* s file reference 


International filing date {day/month/year) 

31 May 2000 (31.05.00) 


Priority date (day/month/year) 
31 May 1999(31.05.99) 


Applicant 

APFEL, Heiko et al 



1. The designated Office is hereby notified of its election made: 

| X| in the demand filed with the International Preliminary Examining Authority on: 

22 November 2000 (22.11.00) 



| | in a notice effecting later election filed with the International Bureau on: 



2. The election 



E 
□ 



was not 



made before the expiration of 19 months from the priority date or, where Rule 32 applies, within the time limit under 
Rule 32.2(b). 



The International Bureau of WIPO 


Authorized officer 




34, chemin des Colombettes 


A. Karkachi 


1211 Geneva 20, Switzerland 




Facsimile No.: (41-22) 740.14.35 


Telephone No.: (41-22) 338.83.38 


Form PCT/IB/331 (July 1992) 


EP0005024 
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PCT 

NOTIFICATION OF THE RECORDING 
OF A CHANGE 

(PCT Rule 92bis.1 and 
Administrative Instructions, Section 422) 


To: 

WEICKMANN, H. 
Weickmann & Weickmann 
Kopernikusstrasse 9 
D-81679 Munchen 
ALLEMAGNE 


Date of mailing (day/month/year) 
09 March 2001 (09.03.01) 


Applicants or agent's file reference 


IMPORTANT NOTIFICATION 


International application No. 
PCT/EPOO/05024 


International filing date (day/month/year) 
31 May 2000(31.05.00) 



1. The following indications appeared on record concerning: 

X the applicant the inventor j^j the agent the common representative 


Name and Address 

CREATOGEN GMBH 
Ulmer Strasse 160a 
D-86156 Augsburg 
Germany 


State of Nationality 
DE 


State of Residence 
DE 


Telephone No. 


Facsimile No. 


Teleprinter No. 


2. The International Bureau hereby notifies the applicant that the following change has been recorded concerning: 
[ | the person X the name the address [^] the nationality the residence 


Name and Address 

CREATOGEN AKTIENGESELLSCHAFT 
Ulmer Strasse 160a 
D-86156 Augsburg 
Germany 


State of Nationality 
DE 


State of Residence 
DE 


Telephone No. 


Facsimile No. 


Teleprinter No. 


3. Further observations, if necessary: 


4. A copy of this notification has been sent to: 
[ X| the receiving Office | | the designated Offices concerned 
| | the International Searching Authority |^X] the elected Offices concerned 
| X| the International Preliminary Examining Authority | | other: 





Authorized officer 


The International Bureau of WIPO 




34, chemin des Colombettes 


A. Karkachi 


1211 Geneva 20, Switzerland 




Facsimile No.: (41-22) 740.14.35 


Telephone No.: (41-22) 338.83.38 
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(PCT Article 36 and Rule 70) 



Applicant's or agent's file reference 


SeeNotificationofTransmittaloflnternational Preliminary 
FOR FURTHER ACTION Examination Report (Fom) PCT/IPEA/416) 


International application No. 

PCT/EPOO/05024 


International filing date (day/month/year) 
31 May 2000 (31.05.00) 


Priority date {day/month/year) 

31 May 1999 (31.05.99) 



International Patent Classification (IPC) or national classification and IPC 
C12Q 1/68 




Applicant 



MAX-PLANCK-GESELLSCHAFT ZUR FORDERUNG DER WISSENSCHAFTEN E.V. 



This international preliminary examination report has been prepared by this International Preliminary Examining Authority 
and is transmitted to the applicant according to Article 36. 



This REPORT consists of a total of . 



. sheets, including this cover sheet. 



□ This report is also accompanied by ANNEXES, i.e., sheets of the description, claims and/or drawings which have been 
amended and are the basis for this report and/or sheets containing rectifications made before this Authority (see Rule 
70. 1 6 and Section 607 of the Administrative Instructions under the PCT), 



These annexes consist of a total of _ 



sheets. 



3. This report contains indications relating to the following items: 
Basis of the report 
Priority 

Non-establishment of opinion with regard to novelty, inventive step and industrial applicability 
Lack of unity of invention 

Reasoned statement under Article 35(2) with regard to novelty, inventive step or industrial applicability; 
citations and explanations supporting such statement 

Certain documents cited 
Certain defects in the international application 
Certain observations on the international application 
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VI 
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VII 
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VIII 


□ 



Date of submission of the demand 

22 November 2000 (22. 1 1 .00) 


Date of completion of this report 

31 May 2002 (31.05.2002) 


Name and mailing address of the IPEA/EP 
Facsimile No. 


Authorized officer 
Telephone No. 



Form PCT/IPEA/409 (cover sheet) (July 1998) 



INTERNATIONAL PRELIMINARY 
EXAMINATION REPORT 



International application No. PCT/EP00/05024 



I. Basis of the report 

The basis of international preliminary examination report is the application as originally filed. 



III. Non-establishment of opinion with regard to novelty, inventive step and industrial 
applicability 

The question of whether the claimed invention appears to be novel, to involve an 
inventive step, or to be industrially applicable has not been the subject of the 
international preliminary examination in respect of the claims which have not been 
searched (Article 17(2)(a) or (3) and Rule 66.1(e) PCT; see also international search report). 

V. Reasoned statement under Article 66.2(a)(ii) with regard to novelty, inventive step or 
industrial applicability 

To the extent that the international preliminary examination has been carried out (see item 
ill above), the following is pointed out: 

In light of the documents cited in the international search report, it is considered 
that the invention as defined in at least some of the eiaims, which have been the 
subject of an international search report, does not appear to meet the criteria 
mentioned in Article 33(1) PCT, i.e. does not appear to be novel and/or to involve 
an inventive step (see international search report, in particular the documents cited 
X and/or Y and corresponding claim references). 
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Name des Anmeldeamts und W PCT International Application"* 
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DE 


Diese Person ist Anmelder | 1 aJlc Bcsiim- RFvl alle Bestimmungsstaaten mitAusnahme | j nur die Vereinigten 1 | die im Zusatzfeld 

furfoIgendeStaaten: 1 1 mungsstaaten HiH der Vereinigten Staaten von Amerika |_J Staaten von Amerika | | angegebencn Staaicn 


Feld Nr. m WEITERE ANMELDER UND/ODER (WEITERE) ERFINDER 


Name und Anschrift: (Familiennamc, Vomame; beijurisxischen Personen vollsxdndige amxliche Bceichmmp 
Bet der Anschrift sind die Postleitzahl und der Name des Staats anzvgeben. Der in dicsem Feld in der 
Anschrift angegebene Staat ist der Staat des Sixzes oder Wohnsines des Anmelders. sofern nachstehend kein 
Staat des Sixzes oder Wohnsines angegeben ist.) 

Creatoaen §mbH. rt 
Ulmer Strafie 160a 

8 6156 Augsburg 


Diese Person tst 
|%xl nur Anmelder 

| | Anmelder und Erfinder 

1 I nur Erfinder (Wird dieses Kastchen 

1 1 angekrevzU so sind die nachstehenden 

Angaben nicht notigj 


StaatsangehCrigkeit (Staat): 
DE 


Sitz oder Wohnsitz (Staat): 
DE 


Diese Person ist Anmelder 1 j aJIe Bcstim- ["""I alle Bestimmungsstaaten mitAusnahme I | nur die Vereinigten 1 I die im Zusatzfeld 

furfolsende Staaten: 1 | mungsstaaten XX der Vereinigten Staaten von Amerika 1 I Staaten von Amerika 1 I angegebenen Staaten 


X Wciterc Anmelder und/oder (weitere) Erfinder sind auf einem Fortsctzungsblan angegeben. 


Feld Nr. IV ANWALT ODER GEMEINSAMER VERTRETER; ODER ZUSTELLANSCHRIFT 


Die folgende Person wird hierroit bestellt/ist bestellt worden. urn fiir den (die) Anmelder, " f 1 gcmeiin*iuier 
vor den zustSndigen intcrnationalcn Bchfirden in folgendcr Eieenschaft zu handeln als: AA 1 — 1 Vertretcr 


Name und Anschrift: {Familiennamc. Vorname: bei jurisxischen Personen yollstdnd'tge amtliche 
Bezeichmmg Bei der Anschrift sind die Postleicahl und der Same des Staats 
anzugeben.) 

Weickmann H., Weickmann F.A., Huber B., 
Liska H., Prechtel J., Bohm B., Weifl W., 
Tiesmeyer J. , Herzog M. / Ruttensperger, B., Jordan V 
KopernikusstraSe 9, 81679 Miinchen /DE 


Telefonnr.: 

089/ 4.55 63-0 


Telefaxnr.: 
089/ 455 63-999 


Fcmschreibnr.: 

^9? fi2t wepat d 


| 1 Zustellanschrift: Dieses Kastchcn ist anzukreuzciu wenn kein Anwalt oder gemcinsamer Vertrcter bestellt ist und Stan dessen im 

1 1 bigen Feld eine spczieile Zustellanschrift angegeben ist. 



r^rmKNn PTT/P O/int mian 1 ^ Hult 1 998^ Siehe Anmerhingen zu dicsem Antragsformular 



•v, * 



Blact Nr. 



FortscGun« von Feld Nr. Ill 



WEITERE ANMELDER UND/ODER (WEITcRE) SRFIiNPER 



*W Ui.cs derfoi-tndtn Ftldcr kenui*. so sailu dives Bias: **«An<r** nicnt M-Jugf wteu 




APFEL Heiko 
RingstraSe 11a 

86356 NeusaB 



Dicsc Person Is:: 
| | nur Ajur.eidcr 

1 xl Anmefder unci Errmdcr 

□ aur crrlndcr WW :£ffr<cr £irre,Tr:: 
G7^^Kd ro rand 1 ^ aechseiiazUx 
Airgzzen nick nati^.) 



Sczsisanzcidrizkeic (Seine): 
DE 



Sicz adcr Wohnsic (Sc. 



| | ii!c Sccim- 



| 1 jj! v2SSS«° eaten von A*nerii^ Ml Scatra ven Acienka t 1 Scotrn 



Dicsc pcrscn isr Anmcidcr 
ff>r fo I gesdcSmr^-i; 

AmcrjTft cx%c%*3*n£ Steer iir der Sccsr der 5tt=n odrr tfe/rraerr 7 



FUCHS Thilo M. 
Wolf ramstrafie 3 



86161 Augsburg 



Dicsc Person isr: 
f | aur Anmcidcr 

|X [ Anmcidcr und Ertlndcr 

□ aur Ertlndcr (Wwd dttsts Kdzreke.t 
<m%ekrrj=^ w rind di 
An%cben aieht nati%.) 



Saaisangchdrigkcit (Sczat): 

DE 



Sicz odcr Wonnsicz (Sc=nz;: 
HE 



Dicsc Person ist Anmcidcr | | jjie aesunj- 



□ 



3csti«xnun53r=at=a tnit Ausaatee 
tie- Vcrraxistca Saacsn von AmcrJcx 



r_. I die Verrinigtsi 
IX I Scatr 



Scacra von Arnerifca 



□ die an 



an ZusaezTcid 
ci:«ne= Scarca 



3<i der/x^A ***** & '^fe&SS^ «xW ir=t 

Ajischrifi <m%c*zom Steer va der Steer des £err oder Wwnxaza sa <uv*w** i 
Steer des Skzzs odtr Wahnsrr-t an*e*€3tn isL) 

#sh GIBBS Carol P. 
^ Auf dem Kreuz 6a 
86152 Augsburg 



Dicsc Person isc 
[ | aur Anmcidcr 

fx] Anmcidcr and Er3nder 

□ aur Ernndcr (Wlrd Sats Ksacha 
<m%*xrzxz so and dU nedstehadat 
Afl$C3ct nick adti%.) 



SnrtrTangcharigkcit (Scoot): 



Sicz adcr Wohcsftr (Soar): 
DE 



iUS 

Dtesc Person ist Anmcidcr 
fur fotzeadeS taoicrt: 



□ 



fnunssscmc 



HamcundAnschrifc «r^c /ar^n,; i,yt^r£rc^ ^ff^ ; Z?£^fM"% 

Anschrifi <mt*Zth<nt Sieet or dzr Steer d* Sic* oder Avkxcx del Asm^a?. saj 
Steer aes Strtrx oder Wohnziizzz aryrjeaert tny 

HUECK Chris toph J. 
HennchstraBe 1 

86159 Augsburg 



Dicsc Person ist: 
[ | aur Anmcidcr 

I Aarncidcr und Enlndcr 

□ nur Erfindcr (Wud dlcza Kesclyn 
ajv^t-r^ io &d die nccbereiitrdtn 
Assies nick ndti^J 



S mf^n gchOrigS;cit (Scut): 
DE 




Dicsc Penon 1st Anmcidcr ( | ji^ B<itim- 

fQr foiicndc5mxen 



3!aa Nr. . . 3. 



Fartsetzun* von Feld Nr. Ill 



weitzre anmeloer und/odek pvinsas) srfi.nder 




MEYER Thomas F, 
HauptstraBe 13 

3 8 533 Vordorf 



Diczc Perse n is:: 
| | nur A-irr.elder 

(xj Anrr.eider unci Erfindcr 

□ nur Errlndc /WW &ser <Cdre.tr:: 



Scaasanssharigxssc (Sciai): 
" DE 



Sicz occr V/afcatc (Scisi): 
DE 



die :rn ZuiiT 



i4n5r5cccr.cn Sen 



Anschrift a^e~*hm Srcef :sr der SlosS its Sicss od*r Wo/wi^S aei ,«ww-i / 
C/^ff d£r i2c£S e^er Wohrei=ss cngrgtbcix or.) 



Dicse Person isu 
[ I aur AnracWcr 

[ I Anmcidcr und crnndcr 

□ 



aur Ernnder (Wird dieszs Kdstehtn 
arrjsxresez. to suid die nachsithznd** 
An%fthtn nieht n6ti%.) 



SaaBangsfcarigksit (Sciic): 



Sicz odcr Wohzsicz (Sc^cj: 



DicseP«oni*A«ncldcr , 1 xll<= 3«ur> | 1 ^^^^^^^nA^^^ D S^^Si CZl ^ 

ffirfaisc3<isSc3at=n: I I fftunssxesttM 1 | dc- Vcrssii gen a 



an Zth i — r cid 
--beicsSeriisi 



Name and Airschrixt: /FsHi/tawsn* Ycrremt: ^^^^^^^^TqV t^d^Jfdd tT£r 
Ajrschrfi <m%r*i:hcns Sices isz der Stcctte Stcss oeur Wcnrtsszss &s A/unoa^ j 
Sto& zes Sices oder Woimsscss <vt~rge3cn tsLj 



Dicsfi Person isc 
[ I aur Aamdder 

I j Annieider and Erfmder 

□ aur Ernnder (Wird dieses K±to^x 
ovi-xr^ so and dU atxaxtna&n 




Dtcse Person is: 
mr fa I grnd^S uai en: 



area: | | aixm&ssszsi I 1 w fc 



□ die im 2^ar="cid 




Ajischrifi arrjcjwcnr SVctt err rfcr Sice: del Scrr o^c 
Secsr 0£S Sices od<r Wohrxixztz oryrje^en tsLj 



Dicsc Person isc 
[ [ aur AiimeJdcr 

[ I Anmclderund crilxidcr 

□ nur Erfindcr K^sclyn 
OTjeirner. w W ^ vsstesentrjitn 
Airphtn idea niti%) 




S mrs a n gcharighcit (Sciac) 



(Or fol jcndc5txiicn: 



mhAusnahiTte ( I nur die Vcrciniccn , ( | 
I ] Stiatcn von Amcriki L— J 



der V«rrinir« n Stxuen von 



/ : 



Blare Nr. ..4. 



Feld Nr. V BESTIMMUNC VON STAATEN 



Die folgcndcn Bestimmungen nach Regel 4.9 Atsatz a werden hiennit vorgenommen (bitte die emsprechencen Kdstchen a/tkrevzen: wenigst&ts tin Kdstchen muB 
angekrevzx werde/t): 
Regtonales Patent 



AP 



EA 



H EP 



ARIPO-Patent: GH Ghana, GtM Gambia. KE Kenia. LS Lesotho; MW Malawi, SD Sudan, SL Sierra Leorte, 
SZ Swasiland, TZ Vereiniete Republik Tanzania, UG Uganda. ZW Simbabwe und jeder weitere Staat, der Vertragsstaat des 
Harare-Protokolb und des PCT ist 

Eurasisches Patent: AM Armenicn, AZ Aserbaidschan, BY Belarus, KG Kirgisistan, KZ Kasachstan, MD Republik 
Moldau, RU Russische FaderarioruTJ TadschikistaruTM Turkmenistan und jeder weitere Staat, der Veruagsstaaides Eurasischen 
PaxentObereinkommens und des PCT ist 

Europaisches Patent: AT Osterreich, BE Belgien, CH und LI Schweiz und Liechtenstein, CY Zypern 
DE Deutschland, DK Danemark, ES Spanien, FI Finnland. FR Frankreich. GB Vereinigtes KSnigreich, GR Griechenland! 
IE trland, IT Italien, LU Luxemburg, MC Monaco, NL Niederlande. PT Porrugal, SE Schweden und jeder weitere Staat, 
der Vertragsstaat des Europauchen Patentubereinkommens und des PCT ist 
S OA OAPI-Patent: BF Burkina Faso, BJ Benin, CF Zencralafrikanische Republik. CG Kongo, CI Cdte d'lvoire, CM Kamerun, 
GA Gabun, GN Guinea. G"VY Guinea-Bissau, ML Mali, MR Maurecanien, >~E Niger, SN Senegal, TD Tschad, TG Togo 
und jeder weitere Staat, der Vertragsstaat der OAPt und des PCT isif/alls line order: Schutzrechaart odtrtin sonstiga Vtrfahnn gtwunscht 

vtirdi bitte mi f der gepunixeicn Unit angeben) 

Nationales Patent (falls sine andere Schutrrechaart oder eln sonstiges Verfahren gevinsdu wird. bitte mf der gepunkteten Li/tie angebtn): 



EI 

m 

m 
m 
m 
ca 
a 
® 

® 
m 
m 
& 
m 

® 

EI 
(3 

m 

(3 

m 

m 

m 

£3 
m 

m 
m 
s 

® 
m 



AE Vercinigte Arabischc Emirate IS 

AL Albanien . . ' 0 

AM Axmenien £3 

AT Osterreich 0 

AU Australien H 

AZ Aserbaidschan (25 

BA Bosnien-Herzegowina 03 

BB Barbados G3 

BG Bulgarien [3 

BR Brasilien 

BY Belarus [3 

CA Kanada 0 

CH und LI Schweiz und Liechtenstein Q 

CN China C2 

CR Costa Rica Qi 

CU Kuba C3 

CZ Tschechische Republik □} 

DE Deutschland (3 

DK Danemark C2 

DM Dominica Q 

EE Estland^ QJ 

ES Spanien Q 

FI Finnland Q 

GB Vereinigtes KOnigreich 3 

GD Grenada Q 

GE Georgien Q 

GH Ghana J 13 



LR Liberia 

LS Lesotho 

LT Litauen 
LU Luxemburg 
LV Lettland 

MA Marokko 

MD Republik Moldau , 

MG Madagaskar , 

MK Die enema! ige jugoslawische Republik 

Mazcdonien 

MN Mongolei 

MW Malawi 

MX Mexiko . : . 

NO Norwegen 

NZ Neuseeiand 

PL Poien 

PT Portugal 

RO Rumanien 

RU Russische Faderation . . 

SD Sudan 
SE Schweden 
SG Singapur 

SI Slowenicn 

SK Slowakci 

SL Sierra Leone , 

TJ Tadschikistan 

TM Turkmenistan 



GM Gambia - 13 TR TOrkei 

HR Kro alien * Q TT Trinidad und Tobago 

HU Ungarn ' [2f TZ Vereinigre Republik Tanzania 

ED Indonesien [3 UA Ukraine 

EL Israel Dt Uganda 

IN Indien j{3 US Vercinigte Staaten von Amerika 

IS Island 

JP Japan S UZ Usbekistan „ 

KE Kenia S VN Vietnam 

KG Kirgisistan H VU Jugoslawien 

KP Dcmokratischc Volksrepubiik Korea H 2A Sudafrika- 

S ZW Simbabwe ?- 

Q KR Republik Korea Kastchen fur die Besammung von Staaten , die dem PCT nach der 

D3 KZ Kasachstan VerdfFcntiichung dieses Formblatts beigctreten sind: 

m LC Saint Lucia • . S P?. .Algerien. . . . 0. . .mz . Mozambique .... 

g LK Sri Lanka £1 J^t^S^. * 

Erkiarang bzgL voraor^Iicher Bcsriramungcn: Zusatzlich zu den oben genannten Bestimmungen nimmt der Anmeider nach Regel 4.9 
Absarz b auch alle anderen nach dem PCT zulisigen Bestimmungen vor mit Ausnahme der tm Znsnrzfeld genannten Bestimmungen, die 
von dicser Erklarung ausgenommen sind. Der Anmeider erkiart, dafl diese zusacdichen Bestimmungen unter dem Vorbehalt einer 
Bcstatigung stehen und iedc zusatzlichc Bestimmunz, die vor Ablauf von 15 Monaten ab dem Prioritatsdatum nicht bestangt wurde, nach 



/ 



Blan Nr. 



Fc!d Nr. VI PRIORITATSANSPRUCH 



I 1 Wcitcrc PrioritaisansprQchc sind im Zusatzfcld angceebcn. 



Anmeldcdatum 
der fruhcrcn Anmeldung 
(T sg/Monat J 



Aktenzeichen 
dcr fruhcrcn Anmelduna 



1st die fruhcrc Anmeldung cine: 



national Anmeldung: 
Staai 



rcgionale Anmcldung:* 
rceionales Ami 



Internationale Anmcldung 
Anmeldcamt 



2cilc(l) 
31.05.1999 



199 24 965.2 



DE 



Zcilc (2) 
17.06.1999 



.199 27 740.0 



DE 



Zciic (3) 
21.07.1999 



199 34 029.3 



DE 



Das Anmeldcamt wird crsucht, cine beglaubigte Abschrift dcr oben in dcr (den) Ze:Ie(n) 

' bczeichncten frOhercii Anmcldung(cn) zu erstcllen und dem imcmaiionaJen BOro zu Qbcrmin=Ih (nor fails dhr jrii/tere Anmcldung(en) bei 

dem Ami c'mgereicht warden ist(smd). das fir die Zwecke dieser internationalen Anmeldung Anmeldcamt ist) 
• Falls es sich bet der fruhcrcn Anmeldung urn eine A RIP O-A rime Idling handelt. so mu/l in dem Zusatzfeld mindestens ein Stoat angegeben verden. der 
Mitglledsuxat der Pariser Verbandsubercinhmfi zum Schuc des gewerblichen Zigcntums ist undjur den die Jruhere Anmeldung eingeretcht wurde. 



Feid Nr. VII INTERNATIONALE RECHERCHENBEHORDE 



(ISA) 

Recherchen- 



Wxhi der interna tionaJen Recherchenbehflrde 
(falls r**ci oder mehr als r>**i 'Internationale 
be hard en fur die Ausfuhrung der internationalen Recherche 
zuszandig sind. geben Sle die von Ihnen gr**thlte Bchdrdc an; 
der Zy*eibuchstaben~Cade kann benud werden) 

ISA/ 



Antrxs auf Num»t der £r*ebnisse einer fruhcrcn Recherche: Bezugnabme auf diese 
frubere "Recherche (falls cine Jruhere Recherche bet der internationalen Recherchcnbehorde 
beantragt oder von ihr durchgejuhrt warden ist): 

Darum (Tag/Monat/Jahr) Aktenzeichen Staat (oder regionales Ami) 



Feld Nr. VIII KONTRO LLISTE; EINREICHUNGSSPRACHE 



Diese intemationale Anmeldung enthalt 
die f Igende Anzahl von Slattern: 

Antrag : 5 

Bcschxcibung (ohne 
Sequenzprotokollteil) 

AnsprOche 

Zusammcnfassung 

Zcichnungcn 

Scquenzprotoko llteil 
der Beschreibung 



98 
12 

1 
89 

183 



Btattzahl insgesamt 



388 



Dieser internationalen Anmcldung iiegen die nachstchend angekreuzten Untcriagcn bei: 

1. Q Blan fur die GebQhrcnbcrcchnung 

2. f3 Gcsondcrtc untcrzcichnetc Vollmacht (1) 

3. □ Kopic dcr ailgemcinen Vollmacht; Aktenzsichcn (falls vorhanden): 

4. □ Bcgrundung fur das Fchlea einer Unterschrift 

5. Q Priorita\tsbeleg(e), in Feld Nr. VI durch 

folgendc Zeilcnnummcr gekennzeichnet: ( 1 ) 

6. □ Obersctzung dcr internationalen Anmeldung in die folgende Sprache: 

7. □ Gcsondcrtc Angaben zu hinteriegten Mikroorganismcn oder andcrem biologischen Material 

8. □ SequenzprotokoUe fur Nucleotide und/oder Aminosaurcn in computcrlesbarcr Form 

9. □ Sonstigc (einzeln auffuhrzn): 



Abbildung der Zcichnungcn, die 
mit der Zusxmmcnfassvtn* 
verofTendicht werden sollfNr.): . 



Sprache, in dcr die 
Internationale Anmeldung 
eingeretcht wird: 



DE 



Feld Nr." DC UNTERSCHRIFT DES ANMELDERS ODER DES ANWALTS 



Der Name jederunterzeichnenden Person ist neben der Unterschrift zu -wiederholeru und es ist anzugeben. sofem sich dies nicht cindeutig 
aus dem Xnarag ergibt. in welcher Eigenschajt die Person unterzeichneu 



Dr. W. WeiB 



Mai 2000 



l. Darum des tatsachlichcn Ein gangs dieser 
internationalen Anmeldung: 



. Vom Anmeldcamt auszuftiilcn 



3. Geandcnes Eingangsdarum aufgrund nachtraelich, jedoch 
fristgerecht cingcgangcncr Unteriagcn oder 2cichnungen 
zur Vcrvollsrandigung dieser internationalen Anmcldung: 



4. Datum des fristgercchten Ein gangs dcr angefordenen 
Richtigstcllungcn nach Artikcl 1 1(2) PCT; 



2. Zcichnungcn 

□ cingc- 
gangen: 

nicht cin- 
gegangen: 



□ 



5. Internal! nale Rcchcrchcnbchorde 
(falls zwei oder mehr zustdndig sind)* 



ISA/ 



□ Obcrmittlune des Recherchenexemplars bis zur 
Zahlung der Kccherchengebuhr aufgeschoben 



Da tum des Ein gangs des Aklencxemplan 
bcim Internationalen BOro: 



^Vom Internationalen BQro auszuflillcn 



; 1 \ 



1 



(12) NACH DEM VERTRAG UFER DIE INTERNATIONALE ZUSAMMEN/ . .BEIT AUF DEM GEBIET DES 
PATENTWESENS (PCT) VEROFFENTLICHTE INTERNATIONALE ANMELDUNG 



(19) Weltorganisation fur geistiges Eigentum 
Internationales Biiro 

(43) Internationales Veroffentlichungsdatum 
7. Dezember 2000 (07.12.2000) 




PCT 



(10) Internationale Veroffentlichungsnummer 

WO 00/73502 A2 



(51) Internationale Patentklassifikation 7 : C12Q 1/68, 
G01N 33/48, C07K 14/205, C12N 15/63, C07K 16/12, 
C12N 1/21, A61K 31/7088, 35/12, 38/16, 39/40, A61P 
31/04, A61K 39/106, 48/00 //(C12N 1/21, C12R 1:01) 



Kreuz 6a, D-86152 Augsburg (DE). HUECK, Christ ph, 
J. [DE/DE]; Hennchstrasse 1, D-86159 Augsburg (DE). 
MEYER, Thomas, E [DE/DE]; Hauptstrasse 13, D-38533 
Vordorf (DE). 



(21) Internationales Aktenzeichen: 



PCT/EP00/05024 



(22) Internationales Anmeldedatum: 

31. Mai 2000 (31.05.2000) 



(25) Einreichungssprache: 

(26) Verdffentlichungssprache: 



Deutscb 
Deutsch 



(30) Angaben zur Prioritat: 

199 24 965.2 31. Mai 1999 (31.05.1999) DE 

199 27 740.0 17. Juni 1999 (17.06.1999) DE 

199 34 029.3 21. Juli 1999 (21.07.1999) DE 

(71) Anmelder (fur alle Bestimmungsstaaten mit Ausnahme 
von US): MAX-PLANCK-GESELLSCHAFT ZUR 
FORDERUNG DER WISSENSCHAFTEN E.V. 
[DE/DE]; Hofgartenstrasse 8, D-80539 Munchen (DE). 
CREATOGEN GMBH [DE/DE]; Ulmer Strasse 160a, 
D-86156 Augsburg (DE). 

(72) Erfinder; und 

(75) Erfinder/Anmelder (nur fur US): APFEL, Heiko 
[DE/DE]; Ringstrasse 11a, D-86356 Neusass (DE). 
FUCHS, Thilo, M. [DE/DE]; Wolframstrasse 3, D-86161 
Augsburg (DE). GIBBS, Carol, P. [US/DE]; Auf dem 



(74) Anwalte: WEICKMANN, H. usw.; Kopernikusstrasse 9, 
D-81679 Munchen (DE). 

(81) Bestimmungsstaaten (national): AE, AG, AL, AM, AT, 
AU, AZ, BA, BB, BG, BR, BY, CA, CH, CN, CR, CU, CZ, 
DE, DK, DM, DZ, EE, ES, FI, GB, GD, GE, GH, GM, HR, 
HU, ID, IL, IN, IS, JP, KE, KG, KP, KR, KZ, LC, LK, LR, 
LS, LT, LU, LV, MA, MD, MG, MK, MN, MW, MX, MZ, 
NO, NZ, PL, PT, RO, RU, SD, SE, SG, SI, SK, SL, TJ, TM, 
TR, TT, TZ, UA, UG, US, UZ, VN, YU, ZA, ZW. 

(84) Bestimmungsstaaten (regional): ARIPO-Patent (GH, 
GM, KE, LS, MW, MZ, SD, SL, SZ, TZ, UG, ZW), eura- 
sisches Patent (AM, AZ, BY, KG, KZ, MD, RU, TJ, TM), 
europaisches Patent (AT, BE, CH, CY, DE, DK, ES, FI, 
FR, GB, GR, IE, IT, LU, MC, NL, PT, SE), OAPI-Patent 
(BF, BJ, CF, CG, CI, CM, GA, GN, GW, ML, MR, NE, 
SN, TD, TG). 

Veroffentlicht: 

— Ohne internationalen Recherchenbericht und erneut zu 
verpffentlichen nach Erhalt des Berichts. 

Zur Erklarung der Zweibuchstaben-Codes, und der anderen 
Abkurzungen wird auf die ErMarungen ("Guidance Notes on 
Codes and Abbreviations") am Anfang jeder reguldren Ausgabe 
der PCT -Gazette verwiesen. 



(54) Title: ESSENTIAL GENE AND GENE PRODUCTS FOR IDENTIFYING, DEVELOPING AND OPTIMISING IMMUNO- 
LOGICAL AND PHARMACOLOGICAL ACTIVE INGREDIENTS FOR THE TREATMENT OF MICROBIAL INFECTIONS 

rjj (54) Bezeichnung: ESSENTTELLE GENE UND GENPRODUKTE ZUR EDEN TIFIZJERUNG, ENTWICKLUNG UND OPTI- 
MIERUNG VON IMMUNOLOGISCHEN UND PHARMAKOLOGISCHEN WIRKSTOFFEN ZUR BEHANDLUNG MEKROBI- 
ELLER INFEKTIONEN 

l/^ (57) Abstract: The invention relates to methods for preparing therapeutic, preventative and/or diagnostic agents for treating micro- 
bial infections and to methods for identifying and characterising essential genes from Helicobacter pylori. The invention also relates 
E]^ to the identified nucleic acids which code for the essential gene products and to the polypeptides which are coded therefrom. 

(57) Zusamraenfassung: Die vorliegende Erfindung betrifft Verfahren zur Bereitstellung von therapeutischen, praventiven oder/und 
diagnostischen Mitteln gegen mikrobielle Infektion und zur Identifizierung und Charakterisierung essentieller Gene aus Helicobacter 
pylori. Weiterhin betrifft sie die identifizierten Nukleinsauren, welche fur die essentiellen Genprodukte kodieren, und die davon 
^ kodierten Polypeptide. 



WO 00/73502 




PCT7EP00/05024 
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Essentiell G ne und Genpr dukte zur Id ntifizierung, Entwicklung und 
Optimierung von immunologischen und pharmakologischen Wirkstoffen zur 
Behandlung mikrobieller Infektionen 

Beschreibung 

Die vorliegende Erfindung betrifft ein Verfahren zur Identifizierung und 
Charakterisierung essentieller Gene von pathogenen Mikroorganismen, deren 
Verwendung zum Auffinden neuer immunologischer und pharmakologischer 
Wirkstoffe zur Prophylaxe, Therapie und Diagnose bakterieller Infektionen, 
sowie die Weiterentwicklung und Optimierung dieser Wirkstoffe. Von der 
Erfindung eingeschlossen sind die entsprechenden Nukleinsauren, welche 
fur die essentiellen Genprodukte kodieren, und die davon kodierten 
Polypeptide. AuSerdem betrifft die Erfindung Vektoren, die die 
erfindungsgema&en Nukleinsauren enthalten, mit diesen Vektoren 
transformierte Zellen und fur die Polypeptide spezifische Antikorper. Diese 
Nukleinsauren und Polypeptide konnen zur Diagnose, Prevention und 
Behandlung von mikrobiellen Infektionen eingesetzt werden, insbesondere 
konnen sie zur Entwicklung von Antikorpern, Impfstoffen und Inhibitoren 
verwendet werden. 

Die vollstandige molekulare Erschlieftung des Genoms des Menschen und 
klinisch relevanter Pathogene offnet neue Wege in der Entwicklung von 
Therapeutika bzw. Prophylaktika gegen die Krankheiten des Menschen. So 
ist die Entschlusselung des menschlichen Genoms fur die nachsten Jahren 
angekundigt- Die Anzahl molekular vollstandig charakterisierter pathogener 
Keime nimmt standig zu. Das erklarte Ziel ist es nun, aus dem 
umfangreichen Datenmaterial solche Gene zu identifizieren, deren Produkte 
als potentielles Ziel fur einen Wirkstoff in Frage kommen und somit fur die 
Entwicklung eines spezifischen Wirkstoff s benutzt werden konnen. Dieses 
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Potential laBt sich aus der Primarstruktur eines Gens nicht ableiten, sondern 
muB experimentell bestimmt werden. 

Liegt die komplette genomische Sequenz eines Organismus vor, steht man 
vor dem Problem, die enorme Datenmenge fur weiterfuhrende biologische 
Analysen zuganglich zu machen. Der erste Schritt ist die Identifizierung 
aller auf dem Genom liegenden Gene. Dies geschieht in der Regel mit Hilfe 
computergestutzter Suchprogramme, die mit einer gewissen Sicherheit 
potentielle Gene vorhersagen konnen. Auf diese Weise konnen Genkarten 
erstellt werden, dieallerdings noch mit einer groSen Ungenauigkeitbehaftet 
sind. Konnen die vom Suchprogramm ausgewiesenen Gene keinem 
bekannten Gen zugeordnet werden, mufJ die Funktionalitat dieser 
hypothetischen Gene durch den physikalischen Nachweis der Genprodukte 
in der ursprungiichen Zelle nachgewiesen werden. 

Eine andere Strategie, die ebenfalls auf der Anwendung spezieller 
Suchprogramme beruht, ist auf die Identifizierung mdglicher Genfamilien 
ausgerichtet, die mit speziellen biologischen Eigenschaften verkniipft sind, 
die wiederum aufgrund weiterer Annahmen als Wirkstoffziel in Betracht 
kommen. Die Suchkriterien sind auf charakteristische Strukturmerkmale 
ausgerichtet, die in der Regel von schon bekannten Genen abgeleitet 
wurden. Das Ergebnis einer solchen Suche kann, in Abhangigkeit von der 
Annaherung der Vorgaben zum wirklichen Zustand, eine hohe Trefferquote 
liefern. In der Regel ist die Ungenauigkeit dieser Verfahren jedoch relativ 
hoch, und die wirkliche biologische Eigenschaft des Gens bzw. dessen 
Genprodukts muB auf jeden Fall experimentell bestatigt werden. 

Eine weitere Strategie erfaSt die Expressionsprodukte einer Zelle, wodurch 
die zum jeweiligen Entwicklungszustand aktiven Gene identifiziert werden 
konnen. Vergleicht man verschiedene Entwicklungszustande miteinander, 
kann auf diese W ise das Zusammenwirken der Gene abgeleitet werden und 
in einigen Fallen kann die biologische Funktion unbekannter Gene teilweise 
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entschlusselt werden. FuhrtmanentsprechendeVergleichsuntersuchungen 
mit Zellen durch, die ein pathologisches Erscheinungsbild haben, ist es 
sogar moglich auch krankheitsverursachende Gene zu identifizieren und 
diese als potentielle Wirkstof fziele fur die Wirkstoffentwicklung einzusetzen . 

Alle beschriebenen Verfahren dienen insbesondere dazu, bislang unbekannte 
Gene zu identifizieren und diesen mit Hilfe Computer-gestutzter 
Datenvergleiche eine biologische Funktion zuzuordnen. Eine eindeutige 
Bewertung eines Gens bzw. Genprodukts hinsichtlich seines Potentials als 
Wirkstoffziel zu dienen und somit fur die Entwicklung von Wirkstoffen 
herangezogen werden zu kdnnen, erfiillt jedoch keines der bekannten 
Verfahren. 

Einige der wichtigsten Voraussetzungen fur einen pathogenen Organismus, 
in einem Wirt zu uberleben und sich zu vermehren, sind einerseits die 
Fahigkeit, dem Irnmunsystem des Wirts zu entgehen, und andererseits die 
Fahigkeit zur Anpassung an einen ganz speziellen Lebensraum oder Nische. 
Die dafiir verantwortlichen Faktoren und Proteine sind somit in der Regel 
essentiell fur den pathogenen Keim. 

Es ware von groSem Vorteil, diese essentieilen Gene von Mikroorganismen 
zu identifizieren, um auf diese Weise die Moglichkeit zur Herstellung von 
therapeutischen, praventiven oder/und diagnostischen Mitteln, z.B. 
Antikorpern, Impfstoffen oder Inhibitoren der entsprechenden Polypeptide 
zu bekommen. 

Ein Pathogen von besonderem medizinischen Interesse ist Helicobacter 
pylori. Dieser Keim ist ein Gram-negatives, spiralformiges Bakterium mit 
hohem pathogenen Potential, das in den letzten Jahren verstarkt 
Resistenzen gegen eine Reihe therapeutisch relevanter Antibiotika 
entwickelt hat und somit von groSer klinischer Bedeutung ist. Es zeichnet 
sich durch extrem hohe Beweglichkeit aufgrund seiner Flagellen und der 
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ungewohnlichen Fahigkeit, im stark sauren Milieu (bis pH 1 ,5) des Magens 
uberleben zu konnen, aus (Goodwin et al., 1989). 

Obgleich das Auftreten von spiralfdrmigen Bakterien in der menschlichen 
Magenschleimhaut seit langenn bekannt ist, weiS man erst seit der 
erfolgreichen Isolierung und Kultivierung dieses Bakteriums (Warren and 
Marshall 1983; Marshall et al., 1984) aus der Magenschleimhaut eines 
Patienten mit einem Magengeschwur (Ulcus ventriculi), date es sich hierbei 
um pathogene Keime handelt. Die /V.py/or/-lnfektion zahlt zu den haufigsten 
chronischen bakteriellen Infektionen des Menschen. Sie tritt weltweit auf, 
wobei ca. 50% der Bevolkerung mit diesem Bakterium infiziert sind. 

Eine Infektion fuhrt zwangslaufig zur Auslosung einer bakteriellen Gastritis 
(Typ-B Gastritis) beim Menschen. Ferner geht man davon aus, daS H. pylori 
auch eine ursachliche Rolle bei der Entstehung von Magen- und 
Zwdlff ingerdarmgeschwuren (Ulcus ventriculi und Ulcus duodeni) sowie bei 
einigen Formen des Magenkarzinoms (Adenokarzinom) spielt (Lee et al., 
1 993; Solnick und Tompkins, 1 993). In zwei Studien von 1 991 wurde eine 
statistisch signifikante Korrelation zwischen der /Y.py/o/y'-lnfektion und dem 
Auftreten des Magenkarzinoms (intestinaler Typ) gezeigt, wobei beide 
Studien zu dem SchluR kamen, daS ca, 60% aller auftretenden 
Magenkarzinome wahrscheinlich auf eine A/.py/o/v-lnfektion zuruckzuf uhren 
sind (Parsonnet et al., 1991; Nomura et al., 1991). Auch die seltener 
auftretenden MALT (Mucosa Associated Lymphoid Tissue) Lymphome des 
Magens, die als Vorstufen von B-Zell-Tumoren des Immunsystems 
angesehen werden, sind vermutlich eine Folge der Mpy/o/v-lnfektion. Eine 
Folge der Langzeitinfektion mit H. pylori ist die atrophische Gastritis, eine 
Degeneration der Schleim, Saure oder Pepsin produzierenden Zellen des 
Magenepithels, die als eine prakanzerose Lasion angesehen werden muS. 

Nach der oralen Aufnahme gelangen die Bakterien zunachst in das extrem 
saure Magenlumen (pH 1 bis 2). Dort wird durch die Produktion des Enzyms 
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Urease, das zur Spaltung des vorhandenen Harnstoffs und damit zur lokalen 
Neutralisierung des sauren pH-Wertes im Mageh fuhrt, was das Uberleben 
der Bakterien ermoglicht. Mitteis chemotaktischer Orientierung und 
fiagellenabhangiger Motilitat bewegen sich die Keime dann in die 
Bicarbonat-gepufferte Schleimschicht der Antrum-Region des Magens, ihren 
eigentlichen naturlichen Habitat. Dort bef inden sie sich in einer einzigartigen 
okologischen Nische, die aufgrund der Saurebarriere nur fur wenige 
konkurrierende Bakterienarten zuganglich ist. Vermutlich orientieren sich die 
Bakterien an den pH-Gradienten zwischen Lumen (pH 1-2) und 
Epithelzelloberflache (pH 6-7), urn zurn Epithel zu gelangen. Durch ihre 
spiralige Form, ihre Beweglichkeit im viskosen Schleim, die Produktion von 
Mukus-modifizierenden Enzymen und schlieBlich durch eine mikroaerophile 
Lebensweise sind diese Keime optimal an die Lebensbedingungen in diesem 
Habitat angepafct. Sie halten sich meist in den tiefen Krypten der Antrum- 
Region auf, wo sie vor au&eren Einflussen wie z.B. Saure, Pepsin aber auch 
vor Medikamenten zu ihrer Eradikation, wie z.B. Antibiotika, geschiitzt sind. 
Ein Teil der Bakterienpopulation <ca. 20%) ist eng mit Epithelzellen 
assoziiert, vor allem mit Schleim produzierenden Zellen. Unter der 
Voraussetzung einer gastralen Metaplasie, d.h. der saureinduzierten 
Ausbildung von gastralem Epithel im Duodenum, kommt es auch zur 
Kolonisierung metaplastischer Areale im Zwolffingerdarm, wodurch die 
Voraussetzungen zur Entstehung des Zwolffingerdarmgeschwurs (Ulcus 
duodeni) geschaffen sind. Durch ihre Fahigkeit zur Adharenz wird vermutlich 
eine komplette Ausscheidung der Helicobacter mit dem abgestofcenen 
Schleim verhindert, so daS die Bakterien fur Jahre, Jahrzehnte oder gar 
lebensiang persistieren konnen (chronische Infektion). 

Bevor die Existenz und die Bedeutung des H. pylori fur die 
Ulkuserkrankungen bekannt waren, wurden diese durch sog. Antazida, oder 
H 2 -Rezeptorantagonisten behandelt. Dabei handelt es sich um Substanzen, 
welche die Sauresekretion der Magenparietalzelle inhibieren. Unter dem 
EinfluS dieser Arzneimittel kommt es zwar zumeist zur Abheilung von 
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Geschwuren, da jedoch eine der Ursachen dieser Geschwure, namlich die 
Mpy/o/v-lnfektion, damit nicht eliminiert wird, kommt es in den meisten 
Fallen nach kurzer Zeit zu einem erneuten Auftreten der Ulzeration (Rezidiv). 

Eine weitere, haufig bei Ulzerationen angewandte Therapie ist die Wismut- 
Behandlung. Verschiedene Wismut-Salze (CBS, BSS) haben einen 
bakteriziden Effekt auf H. pylori. Ein bedeutender Nachteil dieser 
Therapieform ist jedoch, dafc eine totale Eradikation des Keims nur in einem 
sehr geringen Prozentsatz der Falle erreicht wird (8 bis 32%). Wie bei der 
Behandlung mit Antazida kommt es nur zu einer vorubergehenden 
Suppression des Keims, und nach Absetzen der Behandlung erfolgt in den 
meisten Fallen wieder ein Aufflackern der Infektion. Ein weiterer Nachteil 
der Wismut-Behandlung ist, daB eine langer dauerende Therapie mit hohen 
Dosen zu einer Akkumulation dieser Substanz in der Leber, Niere und dem 
Nervensystem fuhrt und betrachtliche neurologische Nebenwirkungen hat 
(Malfertheiner, 1994). 

Seit der Erkenntnis, daft es sich bei den gastroduodenalen 
Ulkuserkrankungen urn Infektionskrankheiten handelt, werden zur 
Behandlung nun auch Antibiotika eingesetzt. Die Monotherapie mit 
verschiedenen Antibiotika (Amoxicillin, Nitrofuran, Furazolidin, Erythromycin 
und dergleichen) stellte sich jedoch als nicht zufriedenstellend heraus, da es 
auch hier nur bei 0 bis 15 % der Zellen zur kompletten Eradikation der 
Keime kommt. Die bisher erfolgreichste Behandlung wird zur Zeit durch eine 
Kombination eines Saureblockers (Ompeprazol) mit einem Antibiotikum 
(Amoxicillin) erreicht, die zu Eradikationsraten bis zu 80% fuhren kann 
(Malfertheiner, 1994). Auf die Dauer ist eine Antibiotikabehandlung zur 
Eliminierung von H. pylori jedoch nicht erfolgversprechend, da aufgrund der 
unvollstandigen Eradikation des Keims mit einer raschen Resistenz- 
entwicklung der Bakterien gegen Antibiotika gerechnet werden mufc. 
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Das zunehmende Auftreten von Antibiotika-Resistenzen und die 
eingeschrankten Behandlungsoptionen, die in der Regel betrachtliche 
unerwunschte Nebenwirkungen haben, macht das Auffinden neuer 
Therapieformen und dabei insbesondere die Identifizierung neuer Wirkstoffe 
notwendig, vor allem Impfstoffe, die sowohl zur prophylaktischen, als auch 
therapeutischen Behandlung von /Ve/ZcoAacter-lnfektionen verwendet 
werden konnen. Von besonderem Interesse ist auch die Darreichungsform, 
da der Wirkstoff im Magen, d. h. in einem extrem sauren Milieu wirksam 
sein muB. Verbindungen mit Protonenblockern, die z. B. vor der 
Verabreichung des prophylaktischen oder therapeutischen Wirkstoffs 
gegeben werden, konnen hierbei von groSem Nutzen sein. 

Die molekulare Grundlage fur persistierende, chronische Helicobacter- 
Infektionen ist bislang noch nicht geklart. Es konnte gezeigt werden, dafc 
die Faktoren Urease, Beweglichkeit und Adharenz essentielle Eigenschaften 
des Bakteriums sind, die gastrische Mukosa kolonisieren zu konnen. 
Obgleich der Wirtsorganismus unter normalen Bedingungen nicht in der Lage 
ist, mit einer Mpy/or/-lnfektion fertig zu werden, zeigte sich im Tiermodell, 
daS die Urease, ein essentieller Virulenzfaktor von H. pylori, ein hohes 
Potential als Vakzin besitzt (US-Patentanmeldung US-SN-07/970,006 
"Urease-based Vaccine Against Helicobacter Infection). 

Diejenigen Komponenten jedoch, die dafur verantwortlich sind, daS das 
Pathogen das Immunsystem des Wirtes umgehen kann, sind bisher noch 
unbekannt. 

Pathogene Organismen im Allgemeinen haben eine Vielzahl von Strategien 
entwickelt, im Wirt uber einen langen Zeitraum vom Immunsystem 
unbehelligt persistieren zu konnen (Haas und Gobel, 1992; Finlay und 
Falkow, 1 997). Ein Mechanismus, der zum Uberleben in lebensfeindlichem 
Milieu dient, ist die Ausbildung einer Uberdauerungsform. 



WO 00/73502 



PCT/EP00/05024 



- 8 - 

Im Falle von H. pylori sind in der Literatur kokkoide Formen als potentielle 
Uberdauerungsformen mehrfach beschrieben, ihre klinische Bedeutung ist 
allerdings umstritten. Kokkoide Formen konnten fur eine ex vivo 
Uberdauerung eine grofJe Rolle spielen. Hinsichtlich der in vivo 
Uberdauerung wurde gezeigt, dafS kokkoide Formen bevorzugt durch ein 
ungunstiges Milieu wie z. B. einen hohen 0 2 -Partialdruck oder subletale 
Gaben von Antibiotika (Wismut-Subcitrat, Erythromycin, Amoxicillin, 
Metronidazol) induziert werden (Donelli et al., 1998; Bode et al., 1993; 
Sorberg et al., 1996; Berry et al., 1995). 

Einige Forscher gehen davon aus, daS diese kokkoiden Bakterien 
lebensfahig, aber nicht kultivierbar sind (VNC, viable but non-culturable). 
Eaton und Mitarbeiter erhielten eine erfolgreiche Infektion von Mini- 
Schweinchen mit vegetativen (spiraligen) H. pylori, wahrend kokkoide 
Formen in diesem Modell keine Infektion zeigten (Eaton et al., 1995). Der 
direkte Nach weis von kokkoiden Formen im menschlichen Magen wurde von 
Chan et al. anhand von Magengewebeschnitten aus Biopsiematerial 
erbracht. In 82.8 % (53/64)der untersuchten Biopsieproben konnten die 
Autoren kokkoide Formen von H. pylori nach weisen (Chan et al, 1994). 
Von Cao et al. wurde ein monoklonaler Antikorper zum spezifischen 
Nachweis von kokkoiden H. pylori im Gewebeschnitt benutzt. Auch hier 
wurden neben den vegetativen Formen in 100 % der Antrumbiopsien (9/9) 
H. pylori kokkoide Formen nachgewiesen (Cao et al., 1997). 

Die Bindung an Epithelzellen und die Fahigkeit zur Signaitransduktion (IL-8- 
Induktion, Rearrangement des Zytoskeletts, Bindung von Plasminogen, 
Laktoferrin und Vitronectin auf der Bakterienoberflache) scheint bei 
kokkoiden Formen vergleichbar zu den vegetativen Formen erhalten zu sein 
(Khin et aL, 1996; Segal et aL, 1996). 

Die oben genannten Experimente deuten auf eine Bedeutung kokkoider 
Formen fur die Uberlebensfahigkeit von Helicobacter \n ungunstigem Milieu 
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hin. Daher ist die Identifizierung von Genen, die mit der Entstehung dieser 
Form und Reaktivierung in die vitale Form zusammenhangen, fur die 
Entwicklung neuer Wirkstoffe von grdfctem Interesse. 

Neben Helicobacter pylori konnen auch andere Helicobacter Spezies den 
Magen des Menschen kolonisieren wie z. B. H, heilmannii und H. fe/is. 
Diesbezuglich konnte gezeigt werden, date auch H. heilmannii mit 
krankhaften Ulkuserkrankungen in Zusammenhang gebracht werden kann. 
Die ursachliche Ubertragung findet wahrscheinlich von Haustieren auf den 
Menschen statt. Bjslang wurde der im Menschen haufig vorkommende 
H.py/ori'm den Verdacht gebracht, bei der Entstehung von Magenkrebs eine 
Rolle zu spielen. Mittlerweile gibt es klinische Daten, die diesen 
Zusammenhang anzweifeln. Besonders werden diese Zweifel durch neuere 
Daten von Helicobacter heilmannii unterstutzt, die diesem ein grdfceres 
kanzerogenes Potential beimessen und dessen Bedeutung bei der 
Entstehung des gastrischen MALT Lymphoms hervorherben (Regimbeau et 
aL, 1988). 

Wird das bisher Gesagte zusammenfassend betrachtet, ist es klar, date ein 
Bedurfnis nach neuen Therapieformen fur die Bekampfung bakterieller 
Krankheitserreger, insbesondere nach Impfstoffen und Inhibitoren von 
essentiellen Genen bzw. deren Expressionsprodukten besteht. Die 
zunehmende Resistenzentwickung gegen eine Vielzahl bewahrter 
Medikamente erfordert eine kontinuierliche Versorgung mit neuen 
Wirkstoffen. Dieser steigende Bedarf an neuen Wirkstoffen kann nur 
gedeckt werden, wenn neue Wirkstoffziele identifiziert und diese zur 
Entwicklung neuer Wirkstoffe herangezogen werden. Essentielle Gene 
stellen fur die Wirkstoffentwicklung ein ideales Ziel dar, da sie fur das 
Oberleben des Krankheitserregers notwendig sind. 

Die Identifizierung essentieller Gene von Helicobacter, insbesondere von 
H. pylori bzw. heilmannii und von mog lichen Helicobacter 
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Uberdauerungsformen zur Entwicklung unci Optimierung neuer 
therapeutischer, praventiver und/oder diagnostischer Mittel, wie z. B. 
Impfstoffe und pharmakologischer Wirkstoffe stellt daher ein Ziel der 
Erfindung dar. Im Vordergrund steht das Auffinden essentieller mikrobieller 
Gene, wobei auch homologe Proteine verschiedener pathogener Keime 
identifiziert werden konnen. Mit Hilfe eines Wirkstoffs konnten dann wie bei 
den klassischen Antibiotika mehrere pathogene Keime gleichzeitig eliminiert 
werden. Bei Helicobacter stehen insbesondere Gene im Vordergrund, die 
lebensnotwendige Funktionen im InfektionsprozeSerfuIlen, sowie Gene, die 
an der Entwicklung und Reaktivierung von kokkoiden Formen beteiligt sind. 
Von besonderem Interesse sind hierbei essentielle Gene, die fur sekretierte 
Genprodukte kodieren, da diese fur immunologische und pharmakologische 
Wirkstoffe aufgrund ihrer exponierten Lokalisation besonders gut erreicht 
werden konnen und daher gute Kandidaten zur Wirkstoffentwicklung sind. 
Weiterhin von Interesse sind essentielle Gene, die fur Genprodukte kodieren, 
die an der Entwicklung und der Aufrechterhaltung von 
Uberdauerungsformen beteiligt sind. Eine weitere Aufgabe ist das Auffinden 
essentieller mikrobieller Gene, wobei auch homologe Proteine verschiedener 
pathogener Keime identifiziert werden konnen. Mit Hilfe eines Wirkstoffs 
konnten dann wie bei den klassischen Antibiotika mehrere pathogene Keime 
gleichzeitig eliminiert werden. 

Diese Aufgabe wird gelost durch ein Verfahren zur Bereitstellung von 
Mitteln zum Nachweis, zur Therapie oder/und zur Prevention von 
mikrobiellen Infektionen, das die folgenden Schritte umfaSt: 
(A) Identifizieren von essentiellen Genen und den entsprechenden 
Polypeptiden durch Herstellung gendefizienter Mikroorganismen durch 
konditionale Antisense-Hemmung (CAI) oder/und subtraktive 
Rekombinations-Mutagenese (SRM) und Bestimmung der Lebens- und 
Uberlebensfahigkeit der gendefizienten Mikroorganismen in einem 
Testsystem. 
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(B) Identifizieren von spezifischen Wirkstoffen, welche gegen die 
essentiellen Polypeptide gerichtet sind und die Inaktiviertung der 
Mikroorganismen oder verwendeter Mikroorganismen herbeifuhren. 

(C) Testen der identifizierten Wirkstoffe auf ihre Anwendbarkeit ais 
Bestandteile von diagnostischen, praventiven oder/und 
therapeutischen Mitteln, 

(D) Formulieren der anwendbaren Wirkstoffe als diagnostische, 
preventive oder/und therapeutische Mittel. 

Das hier dargestellte Verfahren befa&t sich mit der Identifizierung 
essentieller Gene und deren Verwendung zur Entwickiung neuer Wirkstoffe. 

Ein weiterer Aspekt der vorliegenden Erfindung ist somit auch ein Verfahren 
zurn Identifizieren von essentiellen mikrobiellen Genen, das die folgenden 
Schritte umfaBt: 

(i) Herstellen von gendefizienten Mikroorganismen, 

(ii) Bestimmen der Lebens- oder/und Uberlebensfahigkeit der 
gendefizienten Mikroorganismen aus (i), 

(iii) Identifizieren eines proteinkodierenden Abschnitts einer mikrobiellen 
DNA-Sequenz, in der die gendefizienten Mikroorganismen defiziert 
sind und 

(iv) Charakterisieren derjenigen DNA-Abschnitte, die essentiell fur die 
Uberlebensfahigkeit sind. 

CAl ist die Abkurzung fur ^conditional antisense inhibition", d.h. 
konditionale Antisensehemmung. Es handelt sich hierbei urn ein Verfahren, 
welches weiter unten naher beschrieben ist. 

SRM steht fur „subtractive recombination mutagenesis", d.h. subtraktive 
Rekombinationsmutagenese und ist ebenfalls unten beschrieben. 
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Der Ausdruck "gendefizient", wie er hier verwendet wird, bedeutet, date der 
defiziente Organismus nicht in der Lage ist, ein oder mehrere seiner 
Genprodukte herzustellen oder deren Funktion zu nutzen. Die Herstellung 
des entsprechenden Genprodukts kann einerseits durch Mutagenese des 
entsprechenden Gens verhindert werden, oder es kann eine Inhibition 
wahrend der Expression stattfinden, z.B. durch Antisensenukleinsauren. 
Eine Mutagenese kann dazu eingesetzt werden, ein Gen in dem Genom des 
Mikroorganismus zu mutieren, oder dazu, ein mutiertes Gen in den 
Mikroorganismus einzubrigen, wobei man sich auch die homologe 
Rekombination zunutze machen kann. 

Ein protein kodierender Abschnitt einer Nukleinsauresequenz ist beispielweise 
ein Gen oder ein Teil eines Gens das/der die Expression eines Polypeptids 
erlaubt. 

Der Begriff "essentielles Gen" bedeutet ein Gen, das fur ein Genprodukt 
kodiert, ohne welches ein Organismus nicht uberlebensfahig ist oder nur 
beschrankt uberlebensfahig ist. Essentielle Gene konnen in zwei Klassen 
unterteilt werden: obligat essentielle und fakultativ essentielle Gene. Ein 
obligat essentielles Gen kodiert fur ein Protein, das fur das Uberleben oder 
die Vermehrung eines Organismus unter alien Umstanden unabdingbar ist. 
Demgegenuber kodiert ein fakultativ essentielles Gen fur ein Protein, das 
iediglich unter bestimmten Bedingungen fur das Uberleben oder die 
Vermehrung des Organismus notwendig ist, wie z.B. die Fahigkeit des 
Organismus, innerhalb von kultivierten Saugerzellen oder im Tier zu 
uberleben. In beiden Fallen wird das Uberleben oder die Vermehrung des 
Organismus durch die Inaktivierung eines fur ihn essentiellen Gens bzw. die 
Inhibierung eines fur ihn essentiellen Genproduktes stark beeintrachtigt bzw. 
verhindert. Ist ein Bakterium nach der Inaktivierung eines bestimmten Gens 
nicht mehr uberlebensfahig bzw. in der Vermehrung eingeschrankt, kann 
dies als erster Hinweis dafur gewertet werden, daS durch dieses Gen 
essentielle Eigenschaften vermittelt werden. Die Aussagekraft solcher 
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Befunde muR jedoch durch begleitende Kontrollexperimente untermauert 
werden, z.B. sollte eine solche letale Mutation in einem zweiten Schritt 
durch eine entsprechende Komplementation des Gens bzw. Genprodukts 
aufgehoben werden konnen. Obligat essentielle Gene sind demnach solche, 
deren Nichtexpression oder Nichtvorhandensein, z.B. durch Mutagenese 
oder Deletion dazu fuhrt, daR der Organismus weder in natiirlicher 
Umgebung, noch auf einem ideal auf die Bediirfnisse des Mikroorganismus 
abgestimmten Vollmedium lebensfahig ist. 1st ein Mikroorganismus in einem 
fakultativ essentiellen Gen defizient, ist er in der Regel auf einem solchen 
je nach Organismus definierten Vollmedium noch wachstumsfahig, kann 
jedoch in natiirlicher Umgebung, d.h. in seinem naturlichen Wirt oder Zellen 
oder Gewebekulturen seines naturlichen Wirtes nicht mehr uberleben. 

Identifizieren von essentiellen Genen 

Durch das neue Verfahren konnen unabhangig von ihrer speziellen Funktion 
essentielle Gene von Mikroorganismen identifiziert werden. Bevorzugt wird 
dieses Verfahren zur Identifizierung von essentiellen Genen aus Helicobacter 
und verwandten Mikroorganismen eingesetzt. 

In einem ersten Teilschritt wird das komplette Genom eines bakteriellen 
Krankheitserregers mit einem molekulargenetischen Ansatz nach essentiellen 
Genen durchsucht. Dieser Teilschritt erfordert keinerlei Kenntnisse iiber die 
Primarstruktur des Genoms bzw. individueller Gene, sondern erfolgt 
ausschliefclich aufgrund biologischer Kriterien. Ist ein Gen als essentielle 
Determinante identifiziert, wird dessen Identitat ermittelt. Hierbei kann auf 
die ermittelten Rohsequenzdaten der genomischen Sequenzierungen 
zuruckgegriffen werden. Anhand der ermittelten Gensequenz konnen z. B. 
isogene Varianten ermittelt werden bzw. ob sich das ermittelte Gen in einem 
Operon befindet, in dem sich moglicherweise weitere essentielle Gene 
befinden. 
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In einern zweiten Teilschritt werden di identifizierten Gene in spezielle 
genetische Systeme uberfuhrt, die dazu diehen die Gene bzw. deren 
Genprodukte einem direkten Wirkstoff-Screening zuzuftihren und/oder die 
Gene bzw. Genprodukte dazu verwendet, bereits identifizierte Wirkstoffe 
weiter zu optimieren. Der wesentliche Vorteil des Gesamtverfahrens beruht 
auf der rasch aufeinanderfolgenden Ausfiihrung des Gen- und Wirkstoff- 
Screenings in aussagekraftigen biologischen Systemen, so daS in relativ 
kurzer Zeit aus dem kompletten Gensatz eines pathogenen Mikroorganismus 
die potentietlen Wirkstoffziele identifiziert, produziert und diese direkt zum 
Wirkstoff-Screening bzw. Optimierung eingesetzt werden konnen. 

Falls ein Mirkoorganismus untersucht wird, dessen Genom bereits 
sequenziert ist, kann die Identifizierung eines Gens Oder Genabschnitts mit 
Hilfe von Datenbankanalysen erfolgen, wobei einem Sequenzabschnitt ein 
Leserahmen zugeordnet wird. Bevorzugt kann jedoch unabhangig vom 
Vorhandensein einer vollstandigen Genomerzeugung eine beliebige Genbank 
einer Vorselektion unterzogen werden. Dabei kann bevorzugt die 
Vorselektion auf Gene durchgefuhrt werden, die fur Polypeptide mit einer 
bestimmten Funktion kodieren, zum Beispiel mit Hilfe von 
Homologieanalysen. Die Vorselektion kann auch auf Gene durchgefuhrt 
werden, die nur in bestimmten Entwicklungsstufen exprimiert werden. 

Im Rahmen des ersten Teilschritts kann durch Selektionsschritte eine starke 
Reduktion des zu untersuchenden Genmaterials erzielt werden. Z.B. durch 
einen Anreicherungsschritt fur Gene, die fur exportierte oder sekretierte 
Genprodukte kodieren. In diesem speziellen Verfahren werden die DNA- 
Abschnitte einer Genbank von einem Pathogen mutagenisiert, was 
beispielsweise durch Klonieren eines solchen DNA-Abschnitts in ein 
Plasmid, Transformation in einen bevorzugt heterologen Wirtsorganismus 
und anschlielSende Mutagenese erfolgen kann. Das daraus entstandene 
Expressionsprodukt kann dann nachgewiesen werden. Die Mutagenese kann 
beispielsweise durch Insertion einer Markersequenz erfolgen, welche bei 
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Expression der mutagenisierten Sequenz in einem Wirtsorganismus zu einem 
Fusionspolypeptid fiihrt, auf das selektiert werden kann. Die Insertion der 
Markersequenz ist nicht auf Transposoninsertion beschrankt, sondern kann 
auch auf andere Art und Weise erfolgen, beispielsweise durch homologe 
Rekombination oder Infektion und Rekombination mit Hilfe von 
Bakteriophagen. 

Die verwendete Markersequenz im Sinne der vorliegenden Erfindung ist im 
allgemeinen ein Gen, das fur ein Genprodukt kodiert, das eine Selektion auf 
diejenigen Wirtsorganismen erlaubt, welche diese Sequenz exprimieren. Im 
allgemeinen handelt es sich bei diesen Markersequenzen urn Resistenzgene, 
die Resistenz gegen bestimmte Antibiotika verleihen, oder welche es dem 
Wirtsorganismus erlauben, in einem Selektionsmedium zu uberleben und 
sich zu vermehren. Der Genmarker besitzt bevorzugt keine eigenen 
Expressionssignale, sondern istdirekt abhangig von einem vorgeschalteten 
Promoter, wie z.B. dem Transkriptionspromotor auf dem Promotersegment 
oder ein Promoter, der auf dem klonierten heterologen zu identifizierenden 
DNA-Fragment liegt. Alternativ zu Antibiotikaresistenz-Markersequenzen 
konnen auch Enzyme als Genmarker eingesetzt werden. In diesen Fallen 
wird die erfolgreiche Insertion durch eine bestimmte biochemische Reaktion, 
wie z.B. eine Farbreaktion, angezeigt, welche die manuelle Isolierung des 
entsprechenden Bakterienklons erlaubt. 

Wenn die Markersequenz als Fusionsprotein mit dem Expressionsprodukt 
des inserierten DNA-Fragments exprimiert wird und eine Selektion wie oben 
beschrieben durchgefuhrt wird, kann DNA-Material aus den selektierten 
Bakterienklonen isoliert werden und die DNA-Sequenz, die fur das 
Fusionsprodukt kodiert, nach bekannten Verfahren bestimmt werden. Dies 
erlaubt die Zuweisung eines Leserahmens zu dem zu identifizierenden DNA- 
Fragment. Es ist dann mdglich, Vergleichsstudien mit allgemein verfugbaren 
DNA-Sequenzdatenbanken durchzufuhren, um die Identitat des 
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identifizierten Gens abzuklaren und gegebenenfalls Hinweise auf eine 
biologische Funktion zu erlangen. 

Durch technische und weitere Erganzungen der beiden unten dargestellten 
Verfahren, CAI und SRM, kann eine zielgerichtete Reduktion des 
Probenvolumens erreicht werden. Dabei handelt es sich ebenfalls um 
vorgeschaltete Selektionsverfahren, die auf bestimmte Gengruppen abzielen, 
z.B. der Einsatz subtraktiver Genbanken von pathogenen und apathogener 
Vertretern. Hierbei werden pathogenitatsvermittelnde Genbereiche 
angereichert. Derartige Subtraktionsverfahren konnen auch angewendet 
werden, um fur bestimmte Organismen spezifische Gene zu identifizieren, 
beispielsweise durch einen Vergleich und Subtraktion der Genomen von 
H. pylori und H.heilmannii. 

In weiteren Verfahren konnen z.B, Gengruppen identifiziert werden, die nur 
in einem bestimmten Entwicklungsschritt exprimiert werden. 
Hervorzuheben ist beispielsweise das Array-Verfahren, bei dem die 
einzelnen Genproben des Pathogens rasterformig auf einen Trager 
aufgebracht werden. Die einzelnen Auftragspunkte sind bekannt, so daB 
bei einer positiven Hybridisierungsreaktion mit den entwicklungsspezifischen 
Transkriptionsprodukten oder cDNAs oder subtraktiven cDNAs oder 
Fragmente davon, die jeweiligen Gene identifiziert und anschlie&end kloniert 
werden konnen. Andere Verfahren, die entwicklungsspezifische Gengruppen 
erfassen, sind vergleichende Proteom- und Differential-Display-Analysen. 

Um herauszufinden, ob es sich bei den identifizierten Gensequenzen um 
essentielle Gene handelt, werden Mikroorganismen hergestellt, welche in 
den Sequenzen defizient sind, welche den identifizierten Gensequenzen 
entsprechen. Die defizienten Mikroorganismen werden dann auf 
verschiedenen Wachstumsmedien bzw. Zellkulturen oder im Tiermodell oder 
im naturlichen Wirt getestet, und die defizi nten Gene konnen dann je nach 
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Wachstumsfahigkeit einer Kategorie der nicht essentiellen, obligat 
essentiellen oder fakultativ essentiellen Gene zugeordnet werden. 

Auf die Bedeutung von Genen, welche die Entwicklung aus der vitalen in die 
Uberdauerungsform und umgekehrt steuern, ist bereits eingangs 
hingewiesen worden. Es ist daher besonders bevorzugt, eine Vorselektion 
auf solche Gene durchzufiihren. Im Weiteren konnen Verfahren wie CAi 
Oder SRM angewendet werden und die gendefizienten Mikroorganismen 
dann auf bestimmten Nahrmedien untersucht werden, welche den Ubergang 
von der einen in die andere Form auslosen. Bei Helicobacter 'xst insbesondere 
das Schivo-Medium bevorzugt, welches die Reaktivierung der kokkoiden 
Form in die vitale spiralige Form ermoglicht. 

Die Erzeugung von defizienten Mikroorganismen kann auf mehrere Arten 
erfolgen. 

Es stehen eine Reihe von molekulargenetischen Verfahren zur Verfugung, 
das Genom eines bakteriellen Pathogens so zu mutagenisieren, da& von 
jedem Gen eine Mutante zur Verfugung steht. Die gangigste 
Mutagenesemethode beruht auf der Inaktivierung von Genen, z. B. durch 
zufallig im Genom inserierende Transposons, die uber entsprechende Marker 
selektioniert werden. Fur dieses Verfahren bestehen zahlreiche Variationen, 
die auf verschiedene Organismen angewendet werden konnen. (Joyce und 
Grindley, 1984; Akerley, et aL, 1998). Mit Hilfe der inserierten 
Transposons lafct sich auch das mutagenisierte Gen im Genom genau 
lokalisieren. 

Hat man eine Genmutante mit einem nachweisbaren biologischen Effekt 
erzeugt, z.B. ein vermindertes Wachstum der Zellen in einem bestimmten 
Milieu, so mufc in einem zweiten Schritt die eindeutige Kopplung des Gens 
bzw. des Genprodukts mit dieser Eigenschaft nachgewiesen werden. Dies 
geschieht in der Regel durch Komplementationsexperimente. In diesem Fall 
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wird in den Organismus mit der spezifischen Genmutante das ursprungliche 
Gen eingebracht und exprimiert. Kann iiber diesen Weg die ursprungliche 
Eigenschaft des Organismus regeneriert werden, ist der notwendige Beweis 
erbracht. Allerdings la&t sich dieses Verfahren nicht bei der 
Charakterisierung von Letalmutanten anwenden, d.h. bei Mutanten obligat 
essentieller Gene. Einen Ausweg bietet die Verwendung konditionaler 
Mutationen zur Komplementation. Z. B. lassen sich durch chemische 
Mutagenese des untersuchten Gens temperatursensitive Mutanten 
erzeugen, die das Genprodukt bei der normalerweise optimalen 
Wachstumstemperatur in eine inaktive Zustandsform bringen und bei 
niedrigeren Temperaturen ein biologisch aktives Genprodukt hervorbringen 
(Das, et aL, 1976; Harris, eta/., 1992; Hou, eta/, 1994; Polissi and 
Georgopoulos, 1996). In einem anderen praktizierten Ansatz werden die 
wildtypischen Komplementationen durch exogene Substanzen, sogen. 
Induktoren, gesteuert. Uber diese Induktoren wird die Expression des 
komplementierenden Gens eingeschaltet, das auf einem Episom in die 
genspezifische Mutante eingebracht wird und nach Induktion das fehlende 
Genprodukt ersetzt (Murphy, etal., 1 995-. Chow and Berg, 1 988; Arigoni, 
etal., 1998). 

Die genannten Verfahren sind sehr zeitaufwendig und werden nur fur die 
Untersuchung individueller Gene oder begrenzter genomischer Abschnitte 
eingesetzt. Verfahren, die eine durchgangige Charakterisierung des 
vollstandigen Genoms eines ausgewahlten Pathogens nach dem 
beschriebenen Schema ermoglichen, sind bislang nicht bekannt. 

Die nachfolgend beschriebenen neuen genetischen Verfahren, die 
Konditionale Antisense-Hemmung (CAI) und die Subtraktive 
Rekombinationsmutagenese (SRM) erfullen diese Anforderungen. Beide 
Verfahren konnen zur Identifizierung essentieller Gene eingesetzt werd n, 
wobei sich das CAI-Verfahren besonders fur die Identifizierung obligat 
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essentieller Gene eignet und das SRM-Verfahren fur fakultativ essentielle 
Gene. 

Das CAI-Verfahren beruht auf der konditionalen Hemmung der Translation 
von einem oder mehreren Genen # die auf einem klonierten Genomfragment 
(welches dann als Matrize oder Template dient) liegen und uber ein Plasmid 
im zu untersuchenden Keim propagiert werden. Im Vergleich zu 
konventionellen Verfahren bleibt die genomische Struktur des zu 
untersuchenden Keims unverandert, d.h. im Originalzustand. Im zu 
untersuchenden Keim wird die Hemmung der Translation durch die 
konditional induzierbare Synthese spezifischer Antisense-RNA (asRNA) 
ausgelost, die das komplette klonierte Genomfragment umf afct, inklusive der 
auf dem Genomfragment lokalisierten Gene. Die Antisense- 
Nukieinsauresequenzen konnen dann im Mikroorganismus in grofcen Mengen 
synthetisiert werden und binden an die ursprungliche mRNA, wobei diese 
mRNA nicht mehr translatiert werden kann und somit dem 
Expressionsapparat entzogen wird. Die Folge ist, daS entweder kein 
Genprodukt oder nur geringe Mengen davon gebildet werden. Die Synthese 
der asRNA unterliegt der Kontrolle durch einen Promoter (asPromoter), 
dessen Aktivitat konditional, durch definierte, externe Signale gesteuert 
wird. Diese konditionale Inhibition der Expression eines Gens oder Operons 
erfolgt somit uber die Regulation der Synthese der asRNA durch den 
induzierbaren asPromoter. Zum Nachweis, daS ein Gen bzw. Operon, wie 
im vorliegenden Fall, fur das Uberleben und die Vermehrung des Organismus 
unter bestimmten Bedingungen essentiell ist, wird die Uberlebens- und 
Vermehrungsrate eines Klons, in dem die Synthese der asRNA induziert ist, 
mit seiner Uberlebens-/Vermehrungsrate bei nicht induzierter asRNA 
Synthese verglichen. Ist die Uberlebens-/Vermehrungsrate des Klons bei 
Induktion der asRNA Synthese vermindert, so handelt es sich bei dem 
inhibierten Gen bzw. Operon um ein (obligat oder fakultativ) essentielles 
Gen. Diese Wachstumsanalysen konnen automatisiertdurchgefuhrt werden, 
so daS eine sehr groSe Anzahl von Genen innerhalb kurzer Zeit untersucht 
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werden konnen. Aus diesen Klonen wird das Plasmid isoliert und die DNA- 
Sequenz des klonierten Genomfragments, das als Template fur die asRNA 
Synthese dient, bestimmt und in Folge die Struktur des essentiellen Gens 
ermittelt. 

Ein fur das CAI-Verfahren geeigneter Plasmidvektor ist in Abbildung 1 
dargestellt. Er enthalt ein genomisches odersubgenomisches DNA-Fragment 
aus dem zu untersuchenden Mikroorganismus unter der KontroIIe eines 
induzierbaren Promoters (P) und weiteren ublichen Expressionssignalen 
sowie ein mRNA-stabilisierendes Element, so daS das DNA-Fragment in 
Form von Antisense RNA (asRNA) exprimiert werden kann und eine lange 
biologische Aktivitat hat. Ein geeigneter Promoter ist z.B. der Tet-Promoter. 
In einer besonders bevorzugten Ausfiihrungsform kodiert der CAI-Vektor 
zusatzlich ein Gen fur ein regulatorisches Protein, welches den Promoter 
reguliert, in diesem Fall, z.B, den Tet-Repressor, welcher durch ein exogenes 
oder extrazellulares Signal, wie z.B. Tetrazyklin, gesteuert werden kann. Der 
CAI-Vektor der besonderen Ausfuhrungsform von Abbildung 1 enthalt 
weiterhin ein oder mehrere selektionierbare Markergene sowie zwei 
Replikationsursprunge (ori), einen fur den zu untersuchenden 
Mikroorganismus (hier als Pathogen bezeichnet) und einen weiteren fur 
einen ublichen Klonierwirt z.B. E. colL Mit Hilfe solcher CAI-Vektoren konnen 
aus ganzen mikrobiellen Genomen Antisense-Bibliotheken erstellt werden. 

Abbildung 2 zeigt eine schematische Darstellung eines bevorzugten CAI- 
Verfahrens. Von einem CAI-Plasmid, das kleine Fragmente einer 
genomischen Bank des zu untersuchenden Mikrooganismus enthalt, wird 
asRNA von einem induzierbaren Promoter <Pj) aus, unter KontroIIe eines 
extrazellularen Signals synthetisiert (siehe Abb. 1). Die asRNA hybridisiert 
sequenzspezifisch mit der mRNA desjenigen Gens, das dem klonierten DNA 
Fragment auf dem CAI Plasmid entspricht. Durch die Bildung des asRNA- 
mRNA Hybrids wird die Translation dieser mRNA reduziert oder verhindert. 
In Folge entsteht ein defizienter Mikroorganismus, der nicht in der Lage ist. 
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das betreffencle Genprodukt zu bilden. Handelt es sich um das Produkt eines 
essentiellen Gens, dessen Bildung inhibiert wird (A), ist die Lebensfahigkeit 
des entsprechenden Klons eingeschrankt oder verhindert. Die 
Lebensfahigkeit des Mikroorganismus wird im folgenden anhand seiner 
Lebens- oder Uberlebens- oder Vermehrungsrate in einem definierten 
biologischen System bestimmt. Bei nicht erfolgender Induktion der asRNA 
Synthese (B), oder wenn das CAI-Plasmid das Fragment eines nicht- 
essentiellen Gens enthalt (C), ist der Klon des Mikroorganismus normal 
lebens- und vermehrungsfahig. 

In besonders bevorzugten Ausfuhrungsformen des CAI-Verfahrens werden 
ganze Antisense-RNA-Plasmidbanken aus genomischen Fragmenten des zu 
untersuchenden Mikroorganismus analysiert (siehe Abbildung 3). Eine 
genomische Bank mit CAI-Plasmiden (siehe Abb. 1) wird in den zu 
untersuchenden homologen Mikroorganismus unter nicht-induzierenden 
Bedingungen ubertragen und die plasmidtragenden Klone uber einen 
plasmidkodierten Marker selektioniert. Die Lebensfahigkeit der einzelnen 
Klone, die jeweils ein bestimmtes CAI Plasmid aus der Genbank erhalten, 
wird anschlieSend anhand ihrer Vermehrungsrate unter induzierten bzw. 
nicht induzierten Bedingungen ( + und - in der Abbildung), bezogen auf die 
asRNA Synthese, im direkten Vergleich untersucht. In Klonen, die sich unter 
asRNA induzierenden Bedingungen kaum oder nur langsam vermehren, wird 
die Translation von mindestens einem essentiellen Gen verhindert. Aus 
diesen Klonen werden die CAI-Plasmide isoliert. Die essentiellen Gene 
werden durch Sequenzierung der genomischen Fragmente in den isolierten 
CAI-Plasmiden identifiziert. 

Dieser Ansatz laSt sich auch bevorzugt mit einem subtraktiven Verfahren 
kombinieren (SCAI), von dem eine Ausfiihrungsform zur Veranschaulichung 
in Abb. 4 dargestellt ist. Eine genomische Bank mit CAI-Plasmiden (siehe 
Abb. 1 und 3) wird in den zu untersuchenden, homologen Mikroorganismus 
ubertragen und die entstehenden individuellen Klone werden als bakterielle 
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CAI-Bank in einem Pool zusammengefalSt. Dieser Pool wird zur Selektion in 
zwei identische Gruppen {den Driver- und den Tester-Pool) aufgespalten. 

Der Ausdruck "Driver" wird hierbei fur denjenigen Pool von bakteriellen 
Klonen verwendet, der so behandelt wird, daS der induzierbare Promoter 
aktiviert wird und asRNA vom CAI-Vektor exprimiert. Der "Tester" -Pool 
enthalt einen identischen Satz Klone mit CAI-Plasmiden, der jedoch unter 
nicht-induzierenden Bedingungen gehalten wird und somit Wildtyp- 
Eigenschaften besitzt. 

In der Regel wird der "Driver"-Pool zur Selektion (z.B. im Tier) eingesetzt, 
wahrend der "Tester"-Pool unbehandelt aufbewahrt wird. Es konnen aber 
auch beide Gruppen einer Selektion unterzugen werden, wobei lediglich der 
"Driver"-Pool durch Gabe des Signals (z.B, Tetrazyklin) induziert wird. 
Klone, in denen durch die Expression einer bestimmten asRNA die 
Translation eines essentiellen Gens gehemmt wird, gehen wahrend der 
Selektion aus der Gruppe verloren. Nach angemessener Zeit werden die 
uberlebenden Klone beider Gruppen wiedergewonnen und die CAI-Plasmide 
aus den Klonen beider Gruppen isoliert. Die klonierten genomischen 
Fragmente werden anschlieSend uber PCR amplifiziert, wobei Oligonukleotid 
Primer verwendet werden, die mit Vektorsequenzen seitlich der klonierten 
genomischen Fragmente hybridisieren. Diejenigen amplifizierten DNA 
Fragmente, die Teile von essentiellen Genen darstellten, werden durch 
subtraktive Hybridisierung (siehe Abb. 8) angereichert und isoliert. 

Ein erfindungsgemaB fur einen CAI-Vektor geeigneter Promoter ist 
beispielsweise der Tet-Promoter, dessen Aktivitat uber ein regulatorischen 
Protein (in diesem Fall den Tet-Repressor) gesteuert werden kann und durch 
ein extrazellulares Signal (Tetracyclin) induziert werden kann. Weitere 
induzierbare Promoteren sind im Stand der Technik bekannt. 
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Antisense-RNA stabilisierende Elemente sind dem Fachmann auf diesem 
Gebiet bekannt und brauchen hier nicht naher erlautert zu werden. 

Der hohe Wirkungsgrad des CAI Verfahrens bei der Inaktivierung von 
Einzelgenen in einem Organismus ergibt sich aus der uberlappenden 
Klonierung kleiner genomischer Fragmente und der damit einhergehenden 
Synthese unterschiedlicher asRNA Abkommlinge fur einen bestimmten 
Genbereich. Auf diese Art wird die Wahrscheinlichkeit, eine asRNA zu 
erhalten, welche die Translation des gesuchten Zielgens effizient inhibiert, 
stark erhoht. Derartige Untersuchungen konnen auf das komplette Genom 
eines Pathogens ausgerichtet werden, was die Uberprufung einer sehr 
groSen Anzahl individueller genomischer Fragmente erforderlich macht. Hier 
sind apparative Hilfsmittel (Roboter) von Vorteil, um einen hohen 
Probendurchsatz zu erzielen. Alierdings konnen in diesen Fallen nur 
bestimmte Zustande untersucht werden, z. B. das Wachstum der Zellen in 
einem bestimmten Medium. 

Durch den zusatzlichen Einsatzsubstraktiver Verfahrensschritte (Subtractive 
Conditional Antisense Inhibition, SCAI), kann die Anzahl der zu 
untersuchenden individuellen Klone bevorzugt stark reduziert werden. 

Die Subtraktive Rekombinationsmutagenese (SRM) wird bevorzugt zur 
Identifizierung fakultativ essentieller Gene herangezogen. Im Unterschied 
zum CAI-Verfahren werden dauerhafte Genmutationen erzeugt, wobei die 
Anreicherung essentieller Gene uber einen substraktiven Schritt erreicht 
wird. Die SRM Methode kann wie das CAI Verfahren mit kompletten oder 
partiellen Genbanken von pathogenen Mikroorganismen durchgefuhrt 
werden. 

Das SRM Verfahren beruht auf der Inaktivierung einzelner Gene im Genom 
eines Pathogens durch vollstandige Insertion eines bestimmten 
Suizidplasmids, das in dem zu untersuchenden Organismus nicht oder nur 
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unter bestimmten Bedingungen, wie z.B. permissiver Temperatur, replizieren 
kann, wobei dieses ein Teil einer Genbank ist. Die Insertion der Plasmide in 
das Genom erfolgt, durch homologe Rekombination. Die erfolgreiche 
Insertion wird durch Expression eines plasmidkodierten Antibiotikum- 
Resistenzmarkers angezeigt. 

Eine bevorzugte Ausfuhrungsform der SRM-Methode wird anhand der 
Abbildungen 5 bis 8 veranschaulicht. 

In Abbildung 5 ist ein geeigneter SRM-Vektor dargestellt, der wie der CAI- 
Vektor ein genomisches oder subgenomisches DNA-Fragment des zu 
untersuchenden Mikroorganismus enthalt, so wie einen Replikationsursprung 
<ori) fur einen Klonierwirt (z.B. E.colt), ein oder mehrere selektionierbare 
Markergene und einen weiteren konditional aktiven Replikationsursprung fur 
den zu untersuchenden Mikroorganismus, z.B. einen temperatursensitiven 
Ursprung oder einen Ursprung, dessen Aktivitat von einem in trans 
vorhandeneh Replikationsfaktor abhangig ist und der zusatzlich in das 
System eingebracht werden kann. Dadurch, daS das SRM-Plasmid eine 
genortiische Sequenz des zu untersuchenden Mikroorganismus enthalt, 
kommt es bei Transfektion dieses Vektors in diesen Mikroorganismus zu 
einer homologen Rekombination, bei der das gesamte SRM-Plasmid in das 
genomische Gen des Mikroorganismus inseriert wird und das entsprechende 
Gen, falls es sich um ein solches handelt, inaktiviert. Dies fiihrt zu einer 
Insertionsmutante. Geeignete induzierbare Replikationsursprunge sind, wie 
erwahnt, temperatursensitive oris oder solche, die durch einen Faktor 
gesteuert werden konnen, wie z.B. den RGK-Faktor pir oder den pWV 
Faktor repA, der in trans dem System zugefuhrt wird. 

Die Insertion eines SRM-Plasmids (siehe Abb. 5) in das Genom des zu 
untersuchenden Mikroorganismus erfolgt uber homologe Rekombination 
zwischen dem im Plasmid klonierten genomischen Fragment des 
Mikrooganismus und der komplementaren, genomischen DNA Sequenz. 
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Nachdem das Plasmid in den entsprechenden Mikroorganismus uberfuhrt 
worden ist, werden unter nicht permissiven Bedingungen, d.h. bei inaktiver 
Replikation, diejenigen Klone iiber Selektion auf den plasmidkodierten 
Marker isoliert, in welchen das SRM-Plasmid in das Genom inseriert ist. Die 
Exzision des SRM-Plasmids erfolgt ebenfalls uber homologe Rekombination. 
Unter permissiven Bedingungen wird die Replikation des insertierten 
Plasmids eingeleitet, wodurch genugende Mengen an f reiem Plasmid in den 
Zellen entstehen, so da(S das Plasmid aus dem Klon wieder isoliert werden 
kann. Sofern die Insertion eines SRM-Plasmids in ein essentielles Gen 
stattgefunden hat, wird die Lebensfahigkeit des betreffenden Klons 
eingeschrankt (A), wahrend Mutanten in nicht-essentiellen Genen normal 
lebensfahig sind (B). 

Ebenso wie beim CAI-Verfahren kann eine Bank von Insertionsplasmiden 
aus genomischen Fragmenten des zu untersuchenden Mikroorganismus in 
diesen Mikroorganismus ubertragen werden und genomische 
Insertionsmutanten gebildet werden. Diese bevorzugte Ausfuhrungsform des 
SRM-Verfahrens ist in Abbildung 7 dargestellt. Eine Bank von SRM- 
Plasmiden, die einzelne genomische oder subgenomische Fragmente 
enthalten, wird in den zu untersuchenden, homologen Mikroorganismus 
ubertragen. Unter Bedingungen, welche die Plasmidreplikation nicht 
erlauben, wie z.B. bei nicht permissiver Temperatur, werden genomische 
Insertionsmutanten mit Hilfe eines plasmidkodierten Markers (siehe Abb. 5) 
selektioniert. In diesem Schritt konnen nur Insertionsmutanten uberleben, 
die in einem nicht- oder fakultativ essentiellen Gen mutiert sind, da 
Mutanten eines essentiellen Gens nicht lebensfahig sind. Die individuellen 
Insertionsmutanten werden in einem Pool zusammengefaRt und dieser Pool 
anschliefcend in zwei identische Gruppen, den Driver- und den Tester-Pool, 
aufgeteilt. Der Driver-Pool wird selektioniert, z.B. durch die Infektion eines 
Tiers. Der Tester-Pool bleibt unbehandelt. Durch die Selektion gehen solche 
Klone aus dem Driver-Pool verloren, die eine Insertion in einem fakultativ 
essentiellen Gen (das fur das Uberleben und die Vermehrung unter den 
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Selektionsbedingungen notwenclig ist) enthalten. AnschlieSend werden aus 
den uberlebenden Klonen beider Pools, die in das Genom des 
Mikroorganismus inserierten Plasmide unter permissiven Bedingungen 
rezirkularisiert und zuruckgewonnen. In dem Driver-Pool fehlen solche 
Plasmide, die Fragmente von fakultativ essentiellen Genen enthalten. Die in 
den SRM Plasmiden klonierten Fragmente werden in beiden Pools 
anschlieSend uber PCR amplifiziert (siehe Abb. 4). Diejenigen amplifizierten 
DNA Fragmente, die Teile von fakultativ essentiellen Genen darstellen, 
werden durch genetische Subtrakion (siehe Abb. 8) angereichert und 
isoliert. 

Eine besondere Ausfuhrungsform, welche sich eine subtraktive 
Hybridisierung zur Anreicherung in Fragmenten essentieler Gene zunutze 
macht, ist in Abbildung 8 beispielhaft veranschaulicht. 

A: PCR-basierte genetische Subtraktion. Die Tester DNA-Fragmente 
(siehe Abb. 4 und 7) werden mit einem Adapteroligonukleotid in 
soicher Weise ligiert, dafe der Adapter nur mit einem der beiden DNA 
Strange eines doppelstrangigen Tester DNA Fragments kovalent 
verbunden ist, was z.B. durch die Ligation eines doppelstrangigen, 
nicht phosphorylierten Adapters an die 3'-phosphorylierten DNA 
Fragmente der Tester DNA erreicht wird. Diese Tester DNA 
Fragmente werden dann mit einem molaren Uberschuss an Driver 
DNA Fragmenten gemischt. Die Mischung wird denaturiert und 
langsam rehybridisiert. AnschlieSend werden uberhangende 
Einzelstrangenden mit DNA Polymerase zum Doppelstrang aufgefullt. 
Die Produkte dieser Reaktion werden mittels PCR amplifiziert, wobei 
Oligonukleotid Primer verwendet werden, die den Adaptersequenzen 
entsprechen. Nur solche Tester DNA Fragmente, die nicht mit Driver 
DNA Fragmenten hybridisert haben, werden exponentiell amplifiziert 
. somit angereichert und anschliefcend durch Kloni rung isoliert. 
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B: Genetische Subtraktion clurch physikalische Abtrennung von 
biotinylierten DNA Fragmenten. Die Driver DNA Fragmente werden 
biotinyliert und anschlieKend im Uberschufc mit Tester DNA 
Fragmenten gemischt, denaturiert und langsam rehybridisiert. Die 
biotinylierten Homo- Driver-Driver Doppelstrange und Heteroduplexe 
(Driver-Tester Doppelstrange) werden durch Extraktion mit Trager- 
gekoppeltem Streptavidin von den Tester-Tester Homoduplexen 
abgetrennt. Letztere werden durch Klonierung isoliert. 

Die beispielsweise durch SRM erzeugten Insertionsmutanten werden in 
Tierversuchen oder Zellkultursystemen hinsichtlich ihrer veranderten 
biologischen Eigenschaften untersucht. Durch die gezielte Verwendung 
spezieller Wirtszellen, z.B. kultivierte Makrophagen oder Wirtsgewebe, z. B. 
Milz, konnen Gengruppen selektiert werden, die essentielle Eigenschaften 
des Pathogens determinieren, z.B. die Besiedlung bestimmter Wirtszellen. 
Isoliert man die uberlebenden Mutanten aus den Zellen, so fehlen die 
Mutanten essentieller Gene. Subtrahiert man aus der kompletten Genbank, 
die uberlebenden Mutanten, so erhalt man die Mutanten der essentiellen 
Gene. 

Das CAI- bzw. das SRM-Verfahren ist eine sehr effiziente Methode zur ein- 
deutigen Identifizierung und Charakterisierung essentieller Gene. Da essen- 
tielle Gene ein naturliches Ziel fur inhibierende Wirkstoffe darstellen, bieten 
die dargestellten Verfahren eine ideale Grundlage fur die Entwicklung neuer 
Wirkstoffe. 

In den nachfolgend beschriebenen Verfahren werden die identifizierten Gene 
direkt zum Wirkstoff-Screening eingesetzt, wobei im Vergleich zu herkomm- 
lichen Verfahren, auf aufwendige Aufreinigungsschritte verzichtet werden 
kann. Im Mittelpunkt dieser Verfahren stehen bakterielle Tragerzellen, die 
zum Screening nach prophylaktischen und therapeutischen Wirkstoffen 
eingesetzt werden konnen. 
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Die hergestellten gendefizienten Mikroorganismen werden dann auf ihre 
Wachstumsfahigkeit oder ihre Uberlebensfahigkeit getestet. Geeignete 
Testsysteme sind z.B. fn-vitro-Systeme, Zellkultursysteme, Gewebekultur- 
systeme und Tiermodelle als naturliche Umgebung. Wird das Verfahren bei 
H. pylori angewandt, werden die Organismen einerseits auf einem sog. 
Vollmedium angeziichtet, wobei das Vollmedium die bestmoglichen Voraus- 
setzungen fur ein Wachstum furMpy/or/ermoglicht. Gleichzeitig werden die 
defizienten H. pylori Organismen in einer Kultur gezuchtet, welche der 
naturlichen Umgebung von H. pylori mdglichst genau entsprechen soil. Es 
werden hierzu einerseits Zellkulturen basierend auf Primarkulturen oder 
Zellinien aus gastrointestinalem Gewebe verwendet oder aber ausdifferen- 
ziertes Primargewebe (Spharoide) in Kulturmedium. Weitere Moglichkeiten 
zur Simulation der naturlichen Umgebung von H. pylori bestehen in der 
Verwendung von stimulierten Makrophagen, denn H. pylori besitzt die 
Fahigkeit, von diesen nicht aufgenommen und metabolisiert zu werden. 
AuSerdem kann auch uberpruft werden, ob die defizienten H. pylori 
Organismen in der Lage sind, sich in immundefizienten Mausen uber einen 
bestimmten Zeitraum zu etablieren. 

1st ein defizientes H. pylori Bakterium zwar in der Lage, auf Vollmedium zu 
uberleben, wachst aber nicht in einer naturlichen Umgebung, wie oben 
beschrieben, so wird das in diesem Organismus defiziente Gen als fakultativ 
essentielles Gen bezeichnet. 

Wenn der defiziente H. pylori Organismus in keinem der beiden Testlebens- 
raume uberlebensfahig ist, so handelt es sich um ein obligat essentielles 
Gen. 

Allgemein konnen essentielle Gene von Mikroorganismen einer dieser 
Kategorien zugeordnet werden. 
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Aus diesen Ergebnissen konnen dann die in mutierten oder/durch asRNA 
unterdruckten Sequenzen identifiziert und jeweils einer dieser beiden 
Kategorien zugeordnet werden, oder aber der Kategorie der nichtessentiellen 
Gene, wenn der gendefiziente Organismus keine Beeintrachtigungen in 
seiner Wachstumsfahigkeit zeigt. 

Eine weitere Aufgabe der vorliegenden Erfindung ist es # ein genetisches 
Verfahren zur Isolierung und Klonierung der identifizierten essentiellen Gene 
aus verschiedenen klinischen Helicobacter Isolaten bzw. aus heterologen 
pathogenen Keimen von klinischer Bedeutung bereitzustellen. Das 
erfindungsgema&e Verfahren umfaSt daher weiterhin die Schritte 
(v) Herstellen von Primern zur Amplifikation und Detektion von 

homologen Gensequenzen in heterologen Mikroorganismen 
(VI) Identifizieren der homologen Gensequenzen. 

Eine bevorzugte Durchfiihrung dieser weiteren Verfahrensschritte besteht 
darin, sogenannte Megaprimer von den identifizierten essentiellen 
He/icobacter-Genen mittels PCR (Polymerase Chain Reaction) herzustellen, 
deren Sequenz direkt aus den entsprechenden Plasmiden der 
mutagenisierten DNA-Abschnitte abgeleitet werden kann. Diese Primer 
konnen dann verwendet werden, um die bereits identifizierten essentiellen 
Gene aus verschiedenen He/icobacter-\so\aten zu isolieren. Falls diese 
essentiellen Gene Entsprechungen in anderen Mikroorgansimen haben, 
konnen die Primer unter Umstanden auch zur Isolierung dieser Gene aus von 
Helicobacter verschiedenen Mikroorgansimen verwendet werden . Weiterhin 
kann dann die genaue DNA-Sequenz der isolierten Gene und die Feststellung 
der Genvarianz innerhalb der verschiedenen Heiicobacter-\so\a\e bzw. 
zwischen den verschiedenen Mikroorganismen bestimmt werden. 
Bei der Herstellung der Megaprimer entstehen DN A-Fragmente mit variablen 
3'-Enden. Aufgrund dieser Eigenschaft ist es moglich, die DNA-Fragmente 
zur Isolierung variabler, bzw. verwandter Gene mittels des beschriebenen 
PCR-Verfahrens einzusetzen. 
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Identifizieren von spezifischen Wirkstoff n 

Zur Identifizierung neuer immunoiogischer Wirkstoffe aus dem Pool der 
identifizierten essentiellen Gene eines Pathogens bzw. zur 
Weiterentwicklung dieser Wirkstoffe werden bakterielle Trager insof ern sehr 
wirksam eingesetzt, da die identifizierten Gene direkt in diese Tragersysteme 
kloniert und dort exprimiert werden konnen. Das Wirkstoff-Screening 
erfolgt dann direkt mit Hilfe dieser rekornbinanten, bakteriellen Trager. Als 
Trager werden bevorzugt attenuierte Bakterien, wie z.B. Salmonellen, 
verwendet, da diese uber ein naturliches Potential zur Immunstimulanz 
verfiigen. Werden diese attenuierten Bakterien als Trager bzw. 
Produzenten fur die identifizierten essentiellen Gene der pathogenen Keime 
verwendet und wird mit diesen Impfstammen eine Immunisierung an einem 
Saugetier durchgefuhrt, so kann eine nachhaltige Immunantwort ausgelost 
werden. 

Mittlerweile sind die immunologischen Eigenschaften dieser bakteriellen 
Tragersysteme so weit verfeinert worden, dafc eine gezielte Immunantwort 
ausgelost werden kann (VanCott et al., 1 998; Carrier-Patent EP981 1 6827. 
1). Diese Eigenschaft ist insof ern bedeutsam, da die verschiedenen 
Krankheitserreger oftmals nur uber einen bestimmten Zweig des 
Immunsystems wirksam bekampft werden konnen. D.h. schutzvermittelnde 
Antigene lassen sich nur dann identifizieren, wenn sie dem Immunsystem 
in der richtigen Form prasentiert werden. Nur wenn der verwendete Trager 
mit einem wirksamen Antigen beladen wurde, kann es zu einer 
Schutzwirkung kommen. Aufgrund der vielfaltigen immunologischen 
Eigenschaften bakterieller Tragersysteme und deren Uberlegenheit 
gegenuber herkommlichen synthetischen Adjuvantien sind diese zur 
Identifizierung immunologisch relevanter Antigene besonders geeignet. 

Daruber hinaus konnen die bakteriellen Tragersysteme mit effizienten 
Genexpressionssystemen ausgestattet werden, welchedie Herstellung auch 
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problematischer Antigene erlauben (PCT/EP91 /02478, EP981 16827.1). 
Aufgrund der direkten Subklonierung der isolierten essentiellen Gene und 
der einfachen Handhabung der bakteriellen Trager bei der Herstellung und 
Vakzinierung, konnen in relativ kurzer Zeit eine groSe Anzahl von Antigenen 
hinsichtlich ihres immunogenen und protektiven Potentials durchgetestet 
werden. In herkommlichen Verfahren mussen die Test-Antigene dagegen 
zeitaufwendigen Aufreinigungsverfahren unterworfen werden, wobei 
oftmals schon bei der gentechnischen Herstellung der ausgewahlten 
Antigene in Bakterien Schwierigkeiten auftreten, die mit der toxischen 
Wirkung dieser Antigene auf den produzierenden Bakterienstamm verkniipft 
sind. 

Eine wichtige Voraussetzung fur das Entwickeln von Wirkstoffen besteht 
darin, das immunogene Potential der identifizierten Sequenzen festzustellen, 
um zu bestimmen, inwiefern die entsprechenden Genprodukte fur die 
Herstellung von Antikorpern oder Impfstoffen geeignet sind. 

Zur Identifizierung immunologischer Wirkstoffe gegen klinisch relevante 
A/e//co/>acfer-Organismen muf£ zunachst ermittelt werden, in wie weit das 
Genprodukt des identifizierten essentiellen Gens immunogene Eigenschaften 
besitzt. D.h. es muS experimentell ermittelt werden, ob mit dem Antigen 
eine humorale und zellulare Immunantwort in einem Saugetier ausgeldst 
werden kann, die gegen das originale Genprodukt des Erregers gerichtet ist. 
Damit werden auf keinen Fall solche Antigene ausgeschlossen, die im 
Rahmen einer natiirlichen Infektion vom Immunsystem nicht erkannt 
werden. Im Gegenteil, vielmehr konnte man erwarten, daS z.B. bei 
chronisch inf izierten Menschen die Immunantwort gegen schutzvermittelnde 
Antigene unterdriickt ist oder von einer Qualitat ist, die letztendlich keine 
Schutzwirkung vermittelt. AuszuschlieSen sind jedoch solche Antigene, die 
einer hohen genetischen Variation unterliegen und somit einer wirksamen 
Immunantwort kaum zuganglich sind. 
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Zum Nachweis der Identitat des identifizierten Genprodukts bei einer 
naturlich vorkommenden Infektion, wird Antiserum von Patienten 
gewonnen, die entweder unter einer aktiven Gastritis mit Beschwerden 
leiden, oder aus Patienten, bei denen die/Ye//co/)acfer-lnfektion symptomlos 
verlauft. Mit diesen Seren wird das elektrophoretisch aufgetrennte 
rekombinante Protein in einem klassischen Western Blot Verfahren getestet. 
Findet eine Erkennungsreaktion mit einem rekombinanten Protein jeweils mit 
beiden Seren, also dem eines Patienten mit einer fulminanten und dem eines 
Patienten mit einer symptomlosen Helicobacter Infektion, statt, so spielt 
dieses Protein bei einer naturlichen Infektion eine Rolle. Wird das 
rekombinante Polypeptid dagegen nur von dem Serum des Patienten mit 
einer symptomlosen Infektion erkannt, kann das zusatzlich ein Hinweis auf 
ein protektives Potential des entsprechenden Proteins sein. Weiterhin 
konnen Antikorper, die gegen dieses Protein spezifisch gerichtet sind, 
moglicherweise zur passiven Immunisierung eingesetzt werden. 

Von besonderem Interesse sind auSerdem Antikorper von Individuen, die 
nachweislich keine Heficobacter-Trager sind, da diese auf ein protektives 
Potential eines entsprechenden rekombinanten Polypeptids schlieSen lassen. 

Desweiteren werden die immunogenen Polypeptide zusammen mit 
geeigneten Zusatzstoffen zur Immunisierung in vivo eingesetzt- Verwendet 
werden dazu verschiedene Adjuvantien, bakterielle Toxine, Zytokine oder 
ein erfindungsgema&es Polypeptid als Lebendvakzin. Die Immunantwort 
wird daraufhin getestet, ob sie nach einer erfolgten Verabreichung eines 
bestimmten Polypeptids der Erfindung in Kombination mit entsprechenden 
Zusatzstoffen nach Infektion mit dem homologen Keim eine schutzende 
Wirkung gegen weitere homologe Infektionen herbeifuhrt (z.B. Infektionen 
mit verschiedenen H. pylori Stammen). 

Noch eine weitere Moglichkeit zum Testen der Immunogenitat besteht darin, 
im Tiermodell (z.B. Maus, Kaninchen) eine Immunantwort gegen 
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Helicobacter oder andere Mikroorganismen auszulosen und aus den 
immunisierten Tieren Antikdrper zu gewinnen, die dann in einer weiteren 
Western-Blot-Analyse verwendet werden konnen. Gleichzeitig mussen 
Patientenbiopsien in situ immunologisch mit den gleichen Antikdrpern 
untersucht werden, da Helicobacter und andere Mikroorganismen in Kultur 
bestimmte Proteine verlieren oder hinzugewinnen konnen. 

Parallel dazu ist es bevorzugt zu untersuchen, ob gegen eine Infektion mit 
heterologen Keimen (bevorzugt andere gram-negative Bakterien), welche 
das entsprechende Polypeptid exprimieren, eine schutzende Wirkung erzielt 
werden kann. 

Nachdem festgestellt wurde, ob die identifizierten Gene bzw. deren 
Expressionsprodukte in der Lage sind, eine Immunantwort hervorzurufen, 
kann gemaB dem Verfahren der Erfindung weiterhin untersucht werden, ob 
auch eine bereits bestehende Infektion mit derartigen Antigenen behandelt 
werden kann. Kann auf diese Weise ein Polypeptid identifiziert werden, das 
eine therapeutische Wirkung zeigt, wird es bevorzugt auch auf seine 
Aktivitat bei Infektionen mit heterologen Keimen untersucht. 

Das Screening nach prophylaktisch bzw. therapeutisch wirksamen, 
immunologischen Stoffen kann nach folgendem Schema verlaufen, wobei 
die Einhaltung der einzelnen Schritte nicht zwingend ist: 

1 . Klonierung des identifizierten Gens in einen geeigneten bakteriellen 
Tragerstamm und Nachweis sowie Quantifizierung des vollstandigen 
Genprodukts durch SDS-PAGE. 

2. Immunologische Charakterisierung des erzeugten Genprodukts mit 
HHfe von (a) Seren infizierter oder/und naturlich geschutzter Wirte, 
die das Genprodukt im Tragerstamm erkennen sollte; (b) 
Hyperimmunseren von Tieren, die mit dem rekombinanten 
Tragerstamm immunisiert wurden. Wobei das jeweilige 
Hyperimmunserum das originale Genprodukt im pathogenen Keim 
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erkennen sollte. Hierbei kann es moglich sein, dalS das originate 
Antigen nur in einem bestimmten Entwicklungszeitraum vom 
Pathogen produziert wird. 
3. Die protektive Wirkung der individuellen Antigene in der 
prophylaktischen oder/und therapeutischen Anwendungsform wird im 
Tiermodell untersucht. 

Alle protektiven Antigene, die mit den beschriebenen Verfahren identifiziert 
wurden, konnen nunmehr in einem zweiten Schritt weiterentwickelt werden . 
Im Vordergrund dieser Weiterentwicklung steht u. a. die Evaluierung der 
genetischen Konstanz der identifizierten protektiven Antigene innerhalb des 
Pathogens bzw. verwandter pathogener Keime in seiner weltweiten 
Verbreitung. Weiterhin wird zur Entwicklung wirksamer Impfstoffe, auf die 
genetischen Unterschiede im Immunsystem der Impflinge eingegangen. Ziel 
beider Verfahren ist die Identifizierung von Antigenen oder Epitopen, die 
mdglichst breit angewendet werden konnen. Zur Erfassung der 
Genvariabilitat innerhalb einer Spezies bzw. homologer Keime kann der 
sogenannte Mega-Primer-Ansatz eingesetzt werden. Aus dem Plasmid mit 
dem reievanten Gen werden direkt genspezifische Primer mit variablen 3'- 
Enden uber PCR hergestellt, welche die Amplifikation homologer Gene 
ermoglichen. Anhand der ermittelten DNA-Sequenz der amplifizierten Gene 
kann deren Variabilitat abgeleitet und z.B. genkonstante Bereiche bestimmt 
werden. 

Die genetischen Unterschiede zwischen einzelnen Impflingen, auf ein 
definiertes Antigen zu reagieren, kann mit Hilfe einer In V7Y/-o-Vakzinierung 
evaluiert werden. Aus unterschiedlichen Spendern werden hierzu 
antigenprasentierendeZellen (APC) isoliert, z.B. dentritische Vorlauferzellen, 
welche in vitro expandiert und mit den zu testenden Antigenen beschickt 
werden, wobei die Antigene bevorzugt uber entsprechende Vektoren 
exprimiert werden. Die identifizierten Gene konnen auch einzeln oder in 
definierten.Kombinationen in dendritischen Zellen (DC) von nicht infizierten 
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Spendern exprimiert werden. Dabei werden die Genprodukte von der 
Wirtszelle prozessiert und durch den MHC-Komplex prasentiert. DC sind 
besonders fur die Antigenprasentation gegenuber naiven oder 
"schlummernden" T-Zellen geeignet. Werden DC mit T-Zellen autologer 
Spender inkubiert, ist es moglich zu bestimmen, ob dieser Spender gegen 
das eingesetzte Antigen reagieren wurde, wenn er auf naturliche Weise 
damit in Kontakt kame, z.B. im Rahmen einer Schutzimpfung. Anhand der 
Immunantwort der T-Zellen kann auf eine mogliche Immunogenitat des 
entsprechenden Antigens geschlossen werden. Eine solche Immunantwort 
besteht beispielsweise aus einer Proliferation der T-Zellen, bzw. einer 
Zytokin-Ausschuttung insbesondere von IL-2 und IL-4. Die Zytokine konnen 
beispielsweise mit Hilfe eines kommerziell erhaltlichen Assaykits (z.B. von 
Genzyme Cambridge M.A.) ausgewertet werden. 

Schliefclich konnen die in der beschriebenen Weise identifizierten und 
charakterisierten Antigene bzw. Epitope zur Entwicklung der ersten 
Impfstoff-Prototypen eingesetzt werden. Hierbei wird zwischen zwei 
Impfstofftypen unterschieden, der aktiven und der passiven Impfung. 

Zur passiven Immunisierung, werden dem Impfling Antikorper oder 
Antikorperfragmentemitschiitzenderbzw.inhibierenderWirkung vonauBen 

zugefuhrt. 

Antikorper werden in Form von polyklonalen, bevorzugt monoklonalen 
Antikorpern (MAKs) oder rekombinanten Antikorpern bereitgestellt. Hierzu 
gehoren Antikorper, die spezifisch mit Polypeptiden der Erfindung oder 
d eren Untereinheiten und Fragmenten reagieren und fur eine prophylaktische 
und/oder therapeutische Anwendung, z.B. einer passiven Immunisierung, 
verwendet werde konnen. Diese Anti-Protein- oder Anti-Peptid-Antiseren 
bzw. monoklonalen Antikorper konnen mit Hilfe von Standardprotokollen 
z.B. durch die Immunisierung von Tieren wie Mausen, Ratten oder Ziegen 
mit einem gereinigten Polypeptid der Erfindung, einen Fusionsprotein oder 
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einem Subfragment dessen hergestellt werden. Daruber hinaus konnen die 
Tiere auch mit bakteriellen Vakzinetragern immunisiert werden, die mit 
entsprechenden Genen der Erfindung ausgestattet sind und die kodierten 
Polypeptide exprimieren. Die Antikorper sind dabei bevorzugt 
immunspezifisch gegen antigene Determinanten oder Epitope hierzu der 
beschriebenen Helicobacter-Polypeptide oder einem eng verwandten 
Polypeptid, das eine Homologie von mindestens 90% besitzt, gerichtet. Sie 
sind nicht kreuzreaktiv mit Polypeptides die z.B. eine Homologie von 
weniger als 80% aufweisen. 

Ausgehend von einer Zellinie, die einen Polypeptid-spezifischen 
monoklonalen Antikorper produziert, kann aus dem kodierenden Gen eines 
solchen Antikdrpers, chimare Gene geschaffen werden, die Antikorper 
determinieren, bestehend aus einer Antigen bindenden Domane aus der 
Maus und dem Fc-Teil eines Antikorpers des Menschen. Diese Antikorper 
konnen in Zellinien oder transgenen Tieren produziert werden. 

Anstelle von Antikdrpern, die im Tier generiert wurden, konnen auch 
Antikorper-Fragmente, Miniantikdrper, verwendet werden, die z.B. in einem 
heterologen System wie Bakterien hergestellt werden. Diese Miniantikdrper 
konnen entweder monovalent oder bivalent sein und bestehen aus 
dimerisierten Einzelketten-Molekulen (Kujau et al., 1998; Kalinke et al., 
1996; Pack et al., 1993). 

Antikorper gegen die immunogenen Polypeptide der Erfindung konnen auch 
in Pflanzen generiert werden. Beispiele hierzu sind z.B. von Hiatt und Ma 
(1993), van Engelen etal. (1994) und Ma et al. (1994) beschrieben worden. 
Entsprechend derjeweilig verwendeten Pflanze konnen diese z.B. direktzum 
Verzehr und damit als orales Vakzin verwendet werden. 

Eine weiter , sehr breit anwendbare Weise, Antikorper herzustellen, ist in 
Milch und Eiern immunisierter Tiere. Verabreicht man z.B. trachtigen Kuhen, 
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Schafen oder Pferden geeignete Antigene, so finden sich in der Milch 
Immunoglobulins die zur Entwicklung eines Vakzins verwendbar sind. Die 
Milch kann dann entweder direkt als Vakzin verabreicht werden, oder ein 
konzentriertes Immunglobulin-Extrakt hergestellt werden. Auf die gleiche 
Weise kdnnen auch Antikorper (Hyperirhmunantikorper) in Huhnereiern 
produziert werden (Ling et al., 1 998; Sasse et aL, 1 998) . Die beschriebenen 
immunogenen Polypeptide der Erfindung konnen daher auch zur Entwicklung 
eines Milchprodukts oder Huhnereiern verwendet werden, die als orales 
Vakzin verwendet werden konnen. 

ErfindungsgemalS werden die generierten Antikorper oder deren Fragmente 
auf ihre Anwendbarkeit getestet. Sie konnen dazu durch bekannte Verfahren 
auf gereinigt werden (Prazipitation, chromatographische Verfahren) und bei- 
spielsweise darauf untersucht werden, ob sie den Infektionsvorgang von H. 
pylori inhibieren konnen (Adhasionsassays) oder aktivierend auf Komple- 
ment oder ADCC ("antibody-dependent cell-mediated cytotoxicity", anti- 
korperabhangige zellvermittelte Zytotoxizitat) wirken. 

Zur passiven Immunisierung werden die Antikorper, die mit Hilfe der 
Polypeptide der Erfindung generiert wurden, entweder oral oder intra- 
gastrisch verabreicht. Hierfur werden die Antikorper mit einem Bicarbonat- 
Puffer gemischt. Sie konnen aber auch systemisch verabreicht werden, 
wobei sie nicht gepuffert werden mussen. 

Antikorper werden bevorzugt allein oder auch in Kombination mit anderen 
nicht-immunologischen Wirkstoffen verwendet, z.B. mit Antibiotika oder 
Protonenblockern. 

Aktive Vakzinierung beruht auf einer Immunreaktion, die vom geimpften 
Organismus selbst ausgelost wird. Bevorzugt sind Darreichungsformen von 
Impfstoffen als Antigene, Antigenfragmente, Subunit-Vakzin, als DNA- 
Vakzin, als Lebend-Vakzin oder als Lebensmittel-Vakzin. 



WO 00/73502 



PCT/EP00/05024 



- 38 - 

Antigene sind diejenigen Polypeptide oder deren Fragmente, die in vivo eine 
Immunreaktion hervorrufen konnen. 

Wenn ein Polypeptid als Subunit-Vakzin bereitgestellt werden soli, wird es 
zunachst in seine Untereinheiten bzw. Strukturdomanen gemaB seines 
Antigenitatsmusters zerlegt (z.B. T- und B-Zell-Epitope). Dieses 
Antigenitatsmuster kann mit Hilfe eines Computerprogramms erstellt 
werden, wober immunogene Regionen, die aus einer kurzen Polypeptid- 
sequenz von ca. 8 bis 10 Aminosauren bestehen, erkannt werden konnen 
(Hughes et al., 1992). Die einzelnen Polypeptidstiicke konnen dann 
anschliefcend auf ihre Immunogenitat in der Maus oder in Primaten bzw. den 
Menschen getestet werden. Sie konnen dazu entweder als gereinigte 
Polypeptide, die synthetisch hergestellt wurden, in Kombination mit 
entsprechenden Zusatzstoffen wie einem Adjuvans, Toxin oder Cytokin 
verabreicht werden, oder als Fusionsprotein an ein bekannt immunogenes 
Protein bzw. Proteinuntereinheit wie z.B. die Cholera Toxin B Untereinheit 
(Liljeqvist et al., 1997) gekoppelt. Weiterhin konnen die immunogenen 
Peptide in aulSere Membranproteine wie z.B. dem OmpS Maltopdrin von 
E.coli eingebaut und heterolog in einem Vakzin-Tragerstamm exprimiert. 
werden (Lang und Korhonen, 1997). 

Zur Entwicklung eines DNA-Vakzins konnen die in der Erfindung 
charakterisierten Polynukleinsaure-Molekule "nackt" in Fusion mit einem 
eukaryontischen gewebespezifischen Promoter oder in Form eines Plasmids 
verabreicht werden. Die "nackte" DNA oder das entsprechende Plasmid 
wird in Kombination mit einem Zusatzstoff wie einem Fteagenz, das die 
zellulare Permeabilitat verandert wie z.B. Bupivacain (W094/1 6737), 
kationischen Lipiden wie z.B. DOTMA (N-[1-(2,3-dioIeyloxy)propyl]-N,N,N- 
trimethyl-ammoniumchlorid, DOTAP (1 ,2-bis(oleyloxy)-3-trimethyl- 
ammonio)propan), DDAB (dimethyl-dioctadecyl-ammoniumbromid), DOGS 
(dioctadecyl-amidolglycyl-spermidin) bzw. Cholesterinolderivaten, Silica, 
Gold oder Wolfram (Tang et aL 1992) bzw. in Liposomen (WQ93/18759, 
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W093/19768, W094/25608, W095/2397) oder Mikropartikeln verpackt, 
verabreicht. Beispiele fiir brauchbare Promoteren und Genfahren sind von 
Hartikka et al. (1996) beschrieben worden. Zur Applikation der 
Polynukleotid-Molekule konnen jedoch auch z.B. attenuierte Salmonellen 
verwendet werden. Die Bakterien werden hierfur mit eukaryontischen 
Expressionsvektoren, die ein Polynukleotid-Molekul der Erfindung beinhalten, 
transformiert und dann oral verabreicht. Die Plasmid-DN A wird anschlieRend 
vom Bakterium auf den Wirt ubertragen (Darji et aL, 1997). Zur 
Transformation attenuierter Tragerbakterien konnen jedoch auch filamentose 
Phagen verwendet werden. Der Vorteil dieser liegt darin, da& sie eine 
extrem hohe Anzahl von Plasmiden ubertragen konnen. 

Fur die Entwicklung eines Lebendvakzins stehen unter anderem virale, wie 
z.B. adenovirale oder Windpocken-Virus-Vektoren, bzw. bakterielle Vektoren 
wie etwa Salmonella, Shigella oder Lactobacillus zu r Verf iigung . Attenuierte, 
nichtvirulente Salmonella typhimurium-Stamme, die zur rekombinanten 
Expression heteroioger Antigene benutzt werden konnen und oral 
verabreicht werden, wurden vielfach charakterisiert (Mekalanos, 1994, 
W092/1 1361, Cirillo et a/., 1995 und Dorner (1995). Weitere bakterielle 
Vektoren, die als Vakzinvektoren verwendet werden konnen, sind von Cirillo 
et al., (1995) und Dorner (1995) beschrieben worden. Ein Polynukleotid- 
Molekul der Erfindung, das fur ein therapeutisch oder prophylaktisch 
wirksames Polypeptid kodiert, wird hierzu entweder in das bakterielle 
Genom stabil integriert und einem Transportsystem unterworfen, das die 
Darbietung an der bakteriellen Oberflache ermoglicht (PCT/EP94/04286; 
WO97/35022). Das entsprechende Polynukleotid-Molekul kann im 
Bakterium aber auch als Plasmid in freiem Zustand vorliegen. 

Impfstoffe werden in der Regel mit geeigneten Zusatzstoffen wie z.B. 
Adjuvantien, bakteriellen Toxinen, Zytokinen etc. verabreicht, die das 
immunogene Polypeptid in seiner protektiven oder therapeutischen Wirkung 
unterstutzen. Adjuvantien mit geringen Nebenwirkungen zur Verwendung 
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im Menschen, die fur Subunit-Vakzine und Lebend-Vakzine, aber zum Teil 
auch fur DNA-Vakzine in Frage kommen, sind z.B. Aluminiumhydroxid, 
Aluminiumphosphat, Calciumphosphat, N-Acetyl-muramyl-L-threonyl-D- 
isoglutamin, N-Acetyl-normuramyl-L-alanyi-D-isoglutamin, N-Acetyl- 
muramyl-L-alanyl-D-isogIutamyl-L-aIanin-2-(1'-2'-dipaImitoyl-sn-glycero-3- 
hydroxyphosphoryloxy)-ethylamin, Liposomen, Monophosphoryl-Lipid A, 
Trehalosedimicoloat, Pilz-Polysaccharide wie z.B. Schizophyllan, Muramyl- 
Dipeptid, Muramyl-Dipeptid-Derivate, sowie Phorbolester, Saponine und 
immunstimulierende Komplexe (ISCOMS) (Gupta und Siber, 1995). Als 
bakterielles Toxin kann z.B. Cholera Toxin bzw. dessen Untereinhejten oder 
das hitzelabile Toxin aus E.coli verwendet werden. Obwohi diese 
hochpotent als Adjuvantien aktiv sind, konnen sie aufgrund ihrer Toxizitat 
nur begrenzt auf den Menschen angewendet werden. Mit Hilfe bestimmter 
Mutagenesetechniken konnen jedoch Molekule entwickett werden, die aktiv, 
aber ungiftig sind (O'Hagan, 1998). 

Eine weitere Moglichkeit, die Immunantwort auf die prophylaktisch und/oder 
therapeutisch wirksamen Substanzen der Erfindung zu optimieren, ist, das 
entsprechende Polypeptid als Fusionsprotein mit einer immunogenen 
Proteindomane zu exprimieren. Eine Moglichkeit besteht z.B. darin, die Pilin 
DSL-Domane aus Pseudomonas aeruginosa als Fusionspartner zu 
verwenden. Weiterhin beschrieben sind Fusionsproteine, die an Glutathion 
S-Transferase oder Thioredoxin fusioniert wurden (Hill et al., 1997; 
Gabelsberger et al., 1 997). Das entsprechende Fusionsprotein kann jeweils 
als Subunit- oder Lebendvakzin hergestellt und verabreicht werden. 

Die Immunantwort der identif izierten immunologisch wirksamen Substanzen 
kann auch insofern moduliert werden, indem diese in Kombination mit 
bestimmten Zytokinen verabreicht werden. Zur simultanen Verabreichung 
bietet sich eine Co-Expression der Polynukleotid-Sequenzen der Erfindung 
mit einem bestimmten Cytokin in Salmonella oder einem anderen 
Wirtsbakterium an. Das entsprechende Cytokin kann hierzu entweder auf 
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einem separaten Plasmid, in Reihe oder als Fusionsprotein mit der 
gewiinschten Polynukleotid-Sequenz der Erfindung kodiert sein und dann in 
das Wirtsbakterium transformiert werden. In Frage kommen Cytokine, die 
wie z.B. lnterleukin-6 (IL-6) , lnterleukin-1 0 (IL-1 0) oder lnterleukin-1 2 (IL-1 2) 
das Immunsystem stimulieren. 

Zur weiteren Optimierung konnen einzelne immunogen wirksame 
Substanzen der Erfindung miteinander oder in Kombination mit bekannten 
immunogenen Substanzen wie z.B. VacA bzw. dessen einzelne 
Untereinheiten kombiniert werden. Das entsprechende Polypeptid kann also 
gemeinsam mit mindestens einem weiteren Helicobacter Antigen, wie z.B. 
der nativen Urease oder deren Untereinheiten, Fragmenten Homologen, 
Mutanten oder Derivaten derselben exprimiert werden. AuBerdem konnen 
z.B. verschiedene Subunit-Vakzine einzeln oder als Fusionsprotein wie 
weiter oben beschrieben gemeinsam verabreicht werden. Hierfur konnen 
wiederum z.B. gereinigte Polypeptid-Molekiile in Kombination mit einem 
geeigneten Adjuvans, bakteriellen Toxin oder Cytokin verwendet werden. 
Weiterhin konnen diverse Kombinationen von Nukleotid-Sequenzen 
immunogener Untereinheiten der beschriebenen Polypeptid-Molekiile auf 
einem gemeinsamen Plasmid hergestellt und als Lebendvakzin verabreicht 
werden. Ein Vakzinvektor der Erfindung kann also ein oder mehrere 
Polypeptide der Erfindung, Derivate bzw. Fragmente dergleichen enthalten. 
AuBerdem besteht die Moglichkeit der Kombination eines DNA-Vakzins mit 
ein oder mehreren gereinigten Subunit-Vakzinen in einer geeigneten 
Tragersubstanz, wie bereits weiter oben beschrieben wurde. 

Zur Identifizierung neuer pharmakologischer Wirkstoffe aus dem Pool der 
identifizierten essentiellen Gene eines Pathogens bzw. zur 
Weiterentwicklung dieser Wirkstoffe konnen ebenfalls bakterielle Trager sehr 
wirksam eingesetzt werden, da die identifizierten Gene direkt in diese 
Tragersysteme kloniert und dort exprimiert werden konnen. Das Wirkstoff- 
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Screening erfolgt clann direkt mit Hilfe dieser rekombinanten, bakteriellen 
Trager. 

Display-Systeme dienen dazu, ein exprimiertes Polypeptid der Erfindung an 
der Zelloberflache von Bakterien zu prasentieren. Den Transport von 
Polypeptiden durch die innere Membran ermoglicht ein Signalpeptid am 
Aminoende, wahrend andere Anteile die Einlagerung und Verankerung in der 
au&eren Membran ubernehmen. Als Trageranteile sind verschiedene auRere 
Membranproteine von E.coli beschrieben worden wie z.B. PhoE (Agterberg 
et al., (1990) Oder OmpA (Francisco et a/., 1992). Es konnen jedoch auch 
Fusionen mit der Transportdomane des IgA-Proteasevorlaufers IgAfc 
verwendet werden (Klauser et al. , 1 990) . Beispiele fur Display-Systeme sind 
z.B. das DsbA-System (PCT/EP 94/02486) oder das Autotransporter-System 
(AIDA; WO97/35022). Die an der Oberflache prasentierten Polypeptide 
konnen dann fur Bindungsstudien mit Peptid- oder kombinatorischen 
chemischen Substanzenbanken verwendet werden. Die Bindungsstudien 
konnen mit Hilfe eines "High Through Put" Systems, das hohe Testraten 
ermoglicht, in Fliissigkeit oder aber gebundener Form durchgefuhrt werden. 
Hierfur werden die prasentierten Polypeptide z.B. an ein Chromatophor 
gekoppelt, das in Kombination mit einem weiteren Chromatophor, das an 
das Wirkstoff-Peptid oder die chemische Substanz gekoppelt ist, eine 
Farbreaktion ermoglicht. Die entsprechende Wirkstoffkomponente kann 
jedoch auch z.B. mit einem Fluoreszenzfarbstoff markiert oder an eine feste 
Tragermatrix gekoppelt sein. Bei Verwendung eines "Solid Phase Systems" 
wird vorher entweder das verwendete Polypeptid der Erfindung oder aber 
umgekehrt die Peptid- bzw. kombinatorische Wirkstoffbank an die 
Tragermatrix gekoppelt. Die jeweilige f arbstof f markierte Komponente bindet 
dann an die immobilisierte Komponente, wodurch wieder eine Farbreaktion 
ermoglicht wird. Nach der Bindungsreaktion mussen dann mehrere 
Waschvorgange vollzogen werden, bevor die entsprechende Substanz 
isoliert wird. Vorteil des "Solid Phase Systems" gegenuber der Bindung in 
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Flussigkeit ist, daS die wirksame Substanz schneller isoliert werden kann, 
da die ungebundenen Substanzen weggewaschen sind. 

Weitere Verfahren zur Identifizierung neuer pharmakologischer Wirkstoffe 
basieren auf den Kenntnisse aus der Primarstruktur der identifizierten 
essentiellen Gene bzw. benutzen die aufgereinigten gentechnisch 
hergestellten Genprodukte. 

Eine alternative Ausfuhrungsform des erfindungsgemaSen Verfahrens 
besteht darin, spezifische Bindepartner der von den identifizierten Genen 
kodierten Polypeptide zu finden. 

Es konnen bevorzugt Homologiestudien mit Helicobacter und anderen 
Organismen durchgefuhrt werden, z.B. mit Hilfe von Computer-Alignments, 
Southern Blots, PCR und dgl. und anschliefcender Zuordnung der 
Sequenzen. Aufgrund von Homologien kann dann auf potentielle 
Bindepartner der Proteine geschlossen werden. 

Ebenfalls bevorzugt konnen auch kombinatorische Bindungsstudien uber 
Target-gerichtetes-Screening-Verfahren mit Hilfe von Substanzen- 
Bibliotheken durchgefuhrt werden. Die potentiellen bindenden Substanzen 
werden in einer speziellen Anordnung gebunden vorgelegt, z.B. in 
Mikrotiterplatten oder anderen Tragermaterialien. Anschliefcend wird das 
"Target", in der Regel aufgereinigte, gegebenenfalls rekombinante 
He/icobacter-Proteine, in loslicher Form hinzugegeben, was den Nachweis 
einer Wechselwirkung zwischen dem Target und bestimmten Substanzen 
ermoglicht. Ein indirekter Nachweis kann durch markierte Antikorper, die 
gegen die Substanz gerichtet sind, oder durch Einfuhren zusatzlicher 
Elemente ("Tags") in das Target erbracht werden. 

Eine weitere Variante der Bindungsstudien besteht in der Expression von 
//e//co6acfe/'-Proteinen in rekombinanten Bakterien (z.B. solche, die das 
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fluoreszierende Protein GFP oder bestimmte Enzyme herstellen), welche die 
Proteine auf der Oberflache prasentieren, und ahschlie&endes Testen einer 
Substanzen-Bibliothek. 

Weiterhin kann die dreidimensionale Struktur der von den 
erfindungsgema&en identifizierten Genen kodierten Polypeptide oder deren 
Fragmente auch durch kristallographische Analyse ermittelt werden. Bei 
ausreichender Aufldsung konnen eventuelle "Taschen" oder sonstige 
Bindestellen in ihrer dreidimensionalen Struktur exakt charakterisiert werden. 
Aufgrund dieser Daten kann die Struktur potentieiler Bindepartner berechnet 
werden. 

Mit Verfahren, wie etwa "Two-hybrid System", Display-Systemen, "High 
Throughput Screening" oder kombinatorischen Bindungsstudien konnen 
zufallig generierte Polypeptide identifiziert werden, die an die Helicobacter 
Polypeptide der Erfindung oder deren Fragmente, oder an weitere 
erf indungsgemaS identif izierte Polypeptide binden. Wird auf diese Weise ein 
entsprechendes Peptid gefunden, kann dieses chemisch weiter modifiziert 
werden, bis die optimale mogliche Bindung erreicht ist. Das identifizierte 
Polypeptid kann z.B. als Inhibitor verwendet werden, indem es z.B. an ein 
Toxin und ein Internalisierungssignal gekoppelt wird, das den pathogenen 
Keim zerstort oder aber als Peptidmimetikum, um das Binden des Keims an 
die zellulare Oberflache zu verhindern (EP-41 2,762A und EP-B31 ,080A). Mit 
Hilfe des "Two Hybrid Systems" konnen aber auch Aktivatoren des 
Immunsystems generiert werden. Die identifizierten Peptide, die an die 
Helicobacter Polypeptide der Erfindung binden, konnen hierzu an bestimmte 
Liganden z.B. fur den T-Zell-Rezeptor gekoppelt werden. Werden also einem 
von Pathogenen befallenen Tier oder Menschen diese so ausgestatteten 
Peptide verabreicht, wird das korpereigene Immunsystem spezifisch 
angelockt und aktiviert. 
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Die Einhaltung der einzelnen Schritte ist hierbei nicht zwingend, sondern 
kann durch weitere Schritte erganzt bzw. ersetzt werden. 

Die jeweiligen Prototypen eines immunologischen bzw. pharmakologischen 
Wirkstoffs werden nachfolgend weiterentwickelt und verbessert. 

Die Weiterentwicklung eines Impfstoffes kann dahingehend erfolgen, indem 
mehrere antigene Genprodukte oder Teile davon in einem Wirkstoff 
kombiniert werden und/oder mit verschiedenen Tragern bzw. Zusatzstoffen 
verabreicht werden . Als Trager f ungieren verschieden attenuierte bakterielle 
oder virale Organismen und als Zusatzstoff e Adjuvantien und/oder Cytokine. 

Zur Weiterentwicklung eines pharmakologischen Wirkstoffs wird eine als 
wirksam charaktertsierte Leadstruktur chemisch weiter modifiziert, so da& 
eine optimale Bindung und Inhibierung des identifizierten Genprodukts 
erfolgt. Weiterhin sollte der Wirkstoff vom Patienten gut vertragen werden 
und geringe Nebenwirkungen besitzen. 

Zur Identifizierung von Wirkstoffen, die an Polynukleotide binden, kann ein 
Polynukleotid der Erfindung z.B. an eine Tragermatrix vorgekoppelt werden 
bzw. umgekehrt, die Wirkstoffe der Polypeptide- bzw. kombinatorischen 
Substanzenbank. Das verwendete darauffolgende Schema ist das gleiche 
wie das, das fur die Polypeptide schon beschrieben wurde. 

Solche inhibitorischen Substanzen konnen Polypeptide, Peptide, aber auch 
chemische Substanzen sein, wie etwa Antibiotika. Die inhibitorische 
Wirkung kann dabei in verschieden Stadien der Replikation der zu 
bekampfenden Mikroorganismen eingreifen. Beispiele sind 
Expressionsinhibitoren oder Enzyminhibitoren oder sonstige Inhibitoren, 
welche die naturiiche Funktion der Polypeptide von Helicobacter und 
verwandten Mikroorganismen beeinflussen konnen. Solche inhibitorischen 
Substanzen sind ebenfalls Gegenstand der Erfindung. 
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Eine weitere Moglichkeit, einen optimalen Wirkstoff gegen Helicobacter und 
andere bakterielle Infektionen zu finden, ist mit Hilfe von speziellen 
Computerprogrammen. Aufgrund von kristallographischen Daten, die von 
den in der Erfindung beschriebenen Polypeptiden gewonnen wurden kann 
ein Modell erstellt werden, das sterische, elektronische, hydrophobe und 
sogenannten "resultierende Bindungsmomente" (RBMs) miteinander 
verbindet (Ray et al., 1998). Anhand dieses Modells konnen im weiteren 
Substanzen am Computer modelliert werden, die zwar die bereits 
identifizierten Leadstrukturen enthalten konnen, aber mit besseren 
Bindungseigenschaften ausgestattet sind. Es konnen jedoch auch vollig 
neuartige Wirkstoff e entworfen werden. 

Ein weiterer Aspekt der vorliegenden Erfindung ist eine Nukleinsaure, die fur 
ein essentieiles sekretorisches Gen aus Helicobacter pylori kodiert, das 
durch das oben beschriebene erfindungsgemafce Verfahren identifiziert 
wurde. Es wurden essentielle He/icobactergene mit dem vorliegenden 
Verfahren identifiziert, deren Nukleinsauresequenzen in den SEQ ID NO. 1 
bis 245 (ungerade Zahlen) angegeben sind. Eine erfindungsgema&e 
Nukleinsaure ist beispielsweise dadurch gekennzeichnet, date sie 

(a) eine der in SEQ ID NO: n, wobei n eine ungerade ganze Zahl von 1 
bis 245 einschlie&lich ist, dargestellten Nukleinsauresequenzen Oder 
einen proteinkodierenden Abschnitt davon, 

(b) eine einer der Sequenzen aus (a) im Rahmen der Degeneration des 
genetischen Codes entsprechende Nukleotidsequenz oder 

(c) eine mit einer der Sequenzen aus (a) und/oder (b) unter stringenten 
Bedingungen hybridisierende Nukleotidsequenz umfaBt. 

Neben den im Sequenzprotokoll gezeigten erfindungsgema&en 
Nukleotidsequenzen und diesen Sequenzen im Rahmen der Degeneration 
des genetischen Codes entsprechende Nukleotidsequenzen umfaSt die 
vorliegende Erfindung auch Nukleotidsequenzen, die mit einer der zuvor 
genannten Sequenzen hybridisieren. Der Begriff "Hybridisierung" gemafS 
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vorliegender Erfindung wird bei Sambrook et al. (Molecular Cloning, A 
Laboratory Manual, Cold Spring Harbor Laboratory Press (1989), 1.101- 
1.104) verwendet. Vorzugsweise spricht man von einer stringenten 
Hybridisierung, wenn nach dem Waschen fur eine Stunde mit 1 X SSC und 
0,1% SDS bei 50°C, vorzugsweise bei 55°C, besonders bevorzugt bei 
62°C und am meisten bevorzugt bei 68°C, insbesondere fur 1 h in 0,2 X 
SSC und 0,1 % SDS bei 50°C, vorzugsweise bei 55°C, besonders 
bevorzugt bei 62°C und am meisten bevorzugt bei 68°C noch ein positives 
Hybridisierungssignal beobachtet wird. Eine unter derartigen 
Waschbedingungen mit einer oder mehreren der erfindungsgemaBen 
Nukleotidsequenzen oder einer diesen Sequenzen im Rahmen der 
Degeneration des genetischen Codes entsprechenden Nukleotidsequenz 
hybridisierende Nukleotidsequenz ist eine erfindungsgemafce Nukleotidse- 
quenz. 

Vorzugsweise ist die erfindungsgemaSe Nukleotidsequenz eine DNA. Sie 
kann jedoch auch eine RNA oder ein Nukleinsaureanalogon, wie etwa eine 
peptidische Nukleinsaure, umfassen. Besonders bevorzugt umfaSt die 
erfindungsgemaSe Nukleinsaure einen Protein-kodierenden Abschnittder in 
Sequenzprotokoll dargestellten Nukleotidsequenzen oder eine Sequenz, die 
eine Homologie von mehr als 80 %, vorzugsweise mehr als 90 % und 
besonders bevorzugt mehr als 95 % zu den dargestellten Nukleotidse- 
quenzen oder einen vorzugsweise mindestens 20 Nukleotide (nt) und 
besonders bevorzugt mindestens 50 nt langen Abschnitt davon aufweist. 

Die Homologie wird in Prozent identischer Positionen beim Vergleich zweier 
Nukleinsauren (bzw. Peptidketten) angegeben, wobei 100% Homologie die 
vollige Identitat der verglichenen Kettenmolekule bedeutet (Herder: Lexikon 
der Biochemie und Molekularbiologie, Spektrum Akademischer Verlag 
1995). 
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Eine erf indungsgemafce Nukleinsaure kann fur ein sekretiertes Polypeptid mit 
Signalpeptid kodieren oder fur ein sekretiertes Polypeptid ohne Signalpeptid. 

Eine erfindungsgema&e Nukleinsaure umfaBt sowohl die Sequenz des 
kodierenden Strangs als auch die dazu komplementare Sequenz, Letztere 
kann beispielsweise bei der Herstellung von Antisense-Nukleinsauren 
Anwendung finden. 

Ebenfalls Gegenstand der Erfindung ist naturlich auch eine Genbank, die 
mindestens 2, bevorzugt mindestens 20, starker bevorzugt mindestens 1 00 
der genannten Nukleinsauren in Vektoren kloniert enthalt. 

Eine Auflistung der hierin und im Sequenzprotokoll angegebenen 
erfindungsgema&en Nukleinsauren samt ihrer Genprodukte und deren 
Funktionen und putativen Funktionen ist in den Tabellen I und II angegeben. 

Bei den Genen, die im Sequenzprotokoll in ihrer Nukleinsaure- und 
Aminosauresequenz angegeben sind, handelt es sich urn bakterielle Gene. 
Prokaryoten verwenden auBer dem AUG-Codon (mRNA) auch noch andere 
(alternative) Start-Codons. Diese sind AUU (codiert normalerweise fur 
Isoleucin, lie), UUG (codiert normalerweise fur Leucin, Leu) und GUG 
(kodiert normalerweise fur Valin, Val). Im Sequenzprotokoll wurden die 
Aminosauresequenzen gemafc dem normalerweise verwendeten 
Translationscode translatiert. Es wird darauf hingewiesen, da& beim Lesen 
des Sequenzprotokolls die prokaryontische Verwendung alternativer 
Startcodons beriicksichtigt werden muB, und daBsomit hierin auch von den 
Nukleinsauresequenzen gemaB SEQ ID NO. 35, 49, 61, 69, 75, 81, 103 
und 1 05 kodierte Aminosauresequenzen offenbart sind, welche anstatt mit 
einem im Sequenzprotokoll dargestellten jeweiligen Leu-, Val-oder lie-Rest, 
mit einem Methioninrest (Met) anfangen. 
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Auch die folgenden Gen-Sequenzen starten mit alternativen Start-Codons: 
HPC152(UUG); HPC190(UUG); HPN048(GUG); HPN132(GUG); 
HPC010{GUG); HPC036(UUG); HPC056(UUG); HPC16KGUG). Diese 
Codons werden in der Regel als Met translatiert, wenn sie als Startcodons 
5 fungieren. 
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Tabelle I: Obligat essentielle G n 



SEQID 
NO 


Gen 
(obligat 
essentieli) 


Lange 


M "glich Eigenschaften der 
Gen prod ukte 


Signal- 
peptid 


1+2 


HPS001 
(HPS166) 


873bp 


Signalpeptidase I 


+ 


3+4 


HPC003 


267bp 


Protein der Flagellenbiosynthese 




5+6 


HPC005 


714bp 


Lipoprotein 


+ 


7+8 


HPC029 
(HPC030) 


552bp 


Sekretiertes Protein 




9+10 


HPS042 


858bp 


Inneres Membranprotein, Ubiquinol- 
Oxidoreduktase 


- 


11+12 


HPC057 
(HPC109, 
HPC138) 


192bp 


Sekretiertes Protein 


+ 


15+16 


HPS065 
(HPS1 53) 


1629bp 


Lipoprotein 


+ 


17+18 


HPS066 


1377bp 


Inneres Membranprotein, Eisen-Schwefel- 
Bindungsprotein 


- 


21+22 


HPS074 


957bp 


Sekretiertes Protein 


- 


23+24 


HPS083 


480bp 


Sekretiertes / periplasmatisches Protein 




25+26 


HPS084 


1983bp 


Sekretiertes / periplasmatisches Protein 


+ 


27+28 


HPC085 


372bp 


Sekretiertes / periplasmatisches Protein 


+ 


29+30 


HPC090 


558bp 


Sekretiertes / periplasmatisches Protein 


+ 


31+32 


HPS 104 


768bp 


Integrales Membranprotein 


- 


33+34 


HPS115 


2367bp 


ATPase fGr Kationentransport 


- 


35+36 


HPS120 


2751 bp 


AuReres Membranprotein, protektives 
OberflSchenantigen 


+ 


37+38 


HPS 130 


990bp 


Sekretiertes Protein 


+ 


39+40 


HPS133 


1482bp 


MureinvorlSufer-Protein 


- 


41+42 


HPC134 


600bp 


Inneres Membranprotein, Protein- 
Translokationsprotein 


- 


43+44 


HPS143 


1536bp 


Sekretiertes / periplasmatisches Protein 


+ 


45+46 


HPS144 


540bp 


Peptidoglykan-assoziiertes Lipoprotein 


+ 


49+50 


HPS152 


1062bp 


Sekretiertes / periplasmatisches Protein 




51+52 


HPS155 


2202bp 


Protein der Flagellenbiosynthese 




53+54 


HPC157 
(HPC181) 


189 bp 


Sekretiertes Protein 


- 


55+56 


HPS183 


1 008bp 


Eisen(lll)ABC-Transporter 


+ 


57+58 


HPS186 


240bp 


Sekretiertes Protein 




59+60 


HPS188 


1 764bp 


Aufieres Membranprotein 


+ 


61+62 


HPS190 


1443bp 


Sekretiertes / periplasmatisches Protein 


- 


115+116 


HPN165 


8709bp 


Toxin-Shnliches Aulienmembranprotein; 
Autotransporter 


+ 


117+118 


HPC001 


873bp 


Signalpeptidase I 


+ 


119+120 


HPC042 


663bp 


Inneres Membranprotein, Ubiquinol- 
Oxidoreduktase 




121+122 


HPC065 


1 674bp 


Lipoprotein 


+ 


123+124 


HPC066 


697bp 


Inneres Membranprotein, Eisen-Schwefel- 
Bindungsprotein 


n.d. 


125+126 


HPC074 


519bp 


Sekretiertes Protein 


n.d. 


127+128 


HPC083 


480bp 


Sekretiertes / periplasmatisches Protein 




129+130 


HPC084 


1983bp 


Sekretiertes / periplasmatisches Protein 


+ 


131+132 


HPC104 


768bp 


Integrales M mbranprotein 
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133+134 


HPC115 


1510bp 


ATPase fur Kationentransport 


- 


135+136 


HPC120 


1017bp 


Au fie res Membranprotein, protektives 
Oberfiachenantigen 


+ 


137+138 


HPC130 


193bp 


Sekretiertes Protein 


+ 


139+140 


HPC133 


530bp 


Mureinvorl^ufer-Protein 


- 


141+142 


HPC143 


1536bp 


Sekretiertes / periplasmatisches Protein 


+ 


143+144 


HPC144 


88bp 


Peptidoglykan-assoziiertes Lipoprotein 


+ 


145+146 


HPC152 


1080bp 


Sekretiertes / periplasmatisches Protein 


+ 


147+148 


HPC155 


695bp 


Protein der Flagellenbiosynthese 


n.d. 


149+150 


HPC165 


384bp 


Toxin-ahnliches Auftenmembranprotein 
Autotransporter 


+ 


151+152 


HPC183 


1008bp 


Eisen(III)ABC-Transporter 


+ 


153+154 


HPC186 


240bp 


Sekretiertes Protein 




155+156 


HPC188 


264bp 


AuReres Membranprotein 


+ 


157+158 


HPC190 


1443bp 


Sekretiertes / periplasmatisches Protein 
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Tabell II: Fakultativ essenti lie Gene 



SEQ ID 
NO 


Gen 
(fakultativ 
essentiell) 


Lange 


Mogliche Eigenschaften der 
Genprodukte 


Signal- 
peptid 


99+100 


HPS004 
(HPS027. 
HPS121, 
HPS131) 


1644bp 


Inneres Membranprotein 




63+64 


HPC008 
(HPC114, 
HPC145) 


543bp 


Sekretiertes / periplasmatisches Protein 


_ 


65+66 


HPS013 


1746bp 


2\ 3-zyklische Nukleotid-2 - 
Phosphodiesterase 


+ 


67+68 


HPS024 
(HPS025)_ 


1698bp 


Chemotaxis-Protein 


+ 


69+70 


HPS036 


855bp 


Sekretiertes Protein 


+ 


71+72 


HPS038 


669bp 


Sekretiertes Protein 


- 


73+74 


HPS039 
(HPS147) 


804bp 


Sekretiertes Protein 


- 


75+76 


HPS040 


1545bp 


Sekretiertes Protein 


+ 


77+78 


HPS048 


912bp 


Sekretiertes Protein 


+ 


79+80 


HPS050 


834bp 


Periplasmatisches Glutamin-Bindeprotein 


+ 


81+82 


HPS052 


1296bp 


Au&eres Membranprotein 




83+84 


HPS056 


1197bp 


Sekretiertes Protein 


- 


85+86 


HPS059 


1131bp 


Integrates Membranprotein 


+ 


87+88 


HPS063 


516bp 


ATP Synthase F0 t Untereinheit b 


+ 


89+90 


HPS069 


990bp 


Sekretiertes Protein 


+ 


91+92 


HPS091 


684bp 


Integrates Membranprotein 


- 


93+94 


HPS095 


729bp 


Aufteres Membranprotein 


+ 


95+96 


HPS099 


975bp 


Sekretiertes Protein 


- 


97+98 


HPS117 
(HPS118, 
HPS 162) 


1290bp 


Sekretiertes Protein 


+ 


101+102 


HPS132 


3063bp 


Kationenefflux Protein 


+ 


47+48 


HPC140 
(HPC150, 
HPC179) 


1557bp 


AlpA Adhdsin 


+ 


103+104 


HPS149 


2028bp 


Methylakzeptierendes Chemotaxisprotein 


- 


105+106 


HPS161 


273bp 


Sekretiertes Protein 


+ 


107+108 


HPS 176 


759bp 


Protein der cag Pathogenitatsinsel 




109+110 


HPS187 


1245bp 


ZinkabhSngige Metalloprotease 


+ 


111+112 


HPS189 


1566bp 


Sekretiertes Protein 




113+114 


HPS191 


1782bp 


Sekretiertes Protein 


+ 


13+14 


HPS062 


957bp 


Sekretiertes Protein 


- 


19+20 


HPS068 


1533bp 


Lipase 


+ 


159+160 


HPN013 


1401 bp 


Sekretiertes / periplasmatisches Protein 


+ 


161+162 


HPN048 


2577bp 


Zellteilungsprotein 


+ 


163+164 


HPN091 


1329bp 


Natrium- und Chlorid-abhSngiger 
Transporter 




165+166 


HPN132 


1785bp 


Periplasmatischer Oligopeptide-ABC- 
Transporter 


+ 


167+168 


HPN137 


2007bp 


Sekretiert s Protein 


+ 


169+170 


HPN172 


771 bp 


Sekretiertes Protein 


+ 
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A 7<l i A TO 

171+172 


HrUUU4 


1041 Dp 


mneres MemDranproiein 




1 73+1 74 


MrUUlU 


7pQKn 

f ooup 


oeKreiienes rroiein 




175+1 75 


MPOU12 


1 lol Dp 


oeKreiienes rroiein 




177+178 


HPC013 


675bp 


Sekretiertes / peripiasmatisches Protein 


+ 


179+180 


HPC024 


348b p 


Chemotaxis-Protein 


+ 


181+182 


HPC034 


1359bp 


2 , 3 -zykhsche Nukleotid-2 - 
Phosphodiesterase 




183+184 


HPC036 


QCQkn 

OOOUp 


Sekretiertes Protein 


+ 


185+186 


HPC039 


oU4Dp 


Sekretiertes Protein 




187+188 


nPC04o 


1 DO A Dp 


Zeiiteilungsprotein 


+ 


189+190 


HPC050 


CQ/l Kn 

bo4Dp 


An der Flagellenbeweglichkeit beteiligtes 
seKrenenes rToiein 




191+192 


HPC056 


879bp 


Hypothetisches Protein 


+ 


193+194 


HPC059 


A 4 O A krv 

1 lol Dp 


Integraies Membranprotein 




195+1 96 


HPC063 


10oobp 


Sekretiertes Protein 




197+198 


HPC068 


1533bp 


Lipase 


+ 


1 99+200 


HPC069 


516bp 


ATP Synthase r0, Untereinneit b 




201+202 


t m aa^/\ 

HPC070 - 


565bp 


Kationeneffiux Protein 


+ 


203+204 


HPC076 


663bp 


Sekretiertes Protein 




• ****** 

205+206 


HPC091 


454bp 


Natrium- und Chlorid-abhangiger 
Transporter 




207+208 


HPC094 


GOH kn 

921 Dp 


Sekretiertes Protein 




209+21 0 


HPC095 


1572bp 


Konserviertes hypothetisches integrates 
iviemuranproiein 


+ 


211 +21 2 


HHOuyy 


yDDDp 


oeKreiienes rroiein 




213+214 


i jnp 4 r\A 

HPC101 


Q*l Okn 


Kenpiasmaiiscnes oiuiamin-Dinaeproiein 




215+216 


HPC107 


1 ZOO Dp 


au lie res MemDranproiein 




217+218 


HPC1 10 


0 4 Okn 

O iZDp 


oeKrenenes rroiein 


n H 


. 219+220 


HPC1 17 


129UDp 


Sekretiertes Protein 




004 _i_O00 

221 +222 


HHOIzy 


4 / IDp 


oeKreiienes nroiein 




223+224 




•1 QCKn 

lOOOp 


oeKreiienes "roiein 


4. 


22d+22o 




A AQf^kn 

i uyoop 


oeKreiienes rroiein 


4. 


22 r +22o 




A 700k n 

1 / 22Dp 


MeinyiaKzepuerenaes onernoiaxisproicin 




229+23U 


riPOIol 


2/^Dp 


oeKreiienes rroiein 




231 +232 


HPC16Q 

111 v> I 


183bp 


Intearales Membranorotein 




233+234 


HPC172 


543bp 


Sekretiertes Protein 


n.d. 


235+236 


HPC174 


729bp 


Aufteres Membranprotein 


+ 


237+238 


HPC176 


540bp 


Protein der cag Pathogenitatsinsel 




239+240 


HPC180 


864bp 


Sekretiertes Protein 


+ 


241+242 


HPC187 


1072bp 


Zinkabhdngige Metalloprotease 


n.d. 


243+244 


HPC189 


357bp 


Sekretiertes Protein 


+ 


245+246 


HPC191 


1251 bp 


Sekretiertes Protein 


n.d. 



n.d. = nicht bestimmt 



SEQ ID NO 247: zeigt die Sequenz des Vektors pSRM4 (Abbildung 13). 

Die Sequenzen SEQ ID NO. 1 bis 114 sind im beiliegenden Sequenzprotokoll 
dargesteilt. 

Die Sequenzen SEQ ID NO. 1 15 bis 246 sind in den Abbildungen 14 und 15 
dargesteilt. 
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In den nachfolgenden Tabollen A und B sind die NuklelnsSure-Sequenzen der IdentlflzJerten 
Helicobacter Gene (Gen-ID) aufgefQhrt deren NuWelnsflure-Sequenzen n/cht voilatandlg ermlttelt 
warden konnten. Das dargeatelfte Leseraeter der ermlttelten Helicobacter Gensequenzen 1st aufgrund 
der Selektion nach funktlonalen Fusionen mlt dem verwendeten Indlkatorgen, der ft-Lactamaae 
eichergeateltt (slehe Belsplel 3 und 4). 

In Tabgfle A alnd die Helicobacter Gene aufgefQhrt, die eln unvoHatfindlges 6*-£nde und/odar 3'-Ende 
enthalten. In fftbelle B slnd solche Helicobacter Gene aufgefOhrt, denen aufgrund fehlender Sequenz- 
Daten oine odor mehrere AminosSuren nlcht zugeordnet vyerden kfinnen. In alien Fallen kfinnen Stop- 
Codons ausgeachloaaen werden. 



Tabelia A Gen-Sequenzen mil unvollttandlgem 6 1 - und/oder 3'-Ende. 



Kategorle; Obllgat eaaentlelle Gene 



Oen-ID (Intern) 


Fan lands* S'-Enda 


r enlenoes 3 -Ends 


HPC042 




X 


HPCOee 


X 


V 


HPC074 


X 


X 


HPC116 




X 


HPC120 




X 


HPC130 




X 


HPC133 




X 


HPC144 




X 


HPC15S 


X 


X 


HPC165 




X 


HPC188 




X 


Katoaorle: Fakultatlv ••aantielle Qene 




GerHO fintsm) 


Fehlendas 8*-Ende 


Fehlandaa S'-Enda 


HPC010 




X 


HPC024 




X 


HPC034 




X 


HPC048 




X 


HPC070 




X 


HPC078 




X 


HPC091 




X 


HPC101 




X 


HPC107 




X 


HPC110 


X 


X 


HPC129 




X 


"~ HPC137 




X 


HPC149 




X 


HPC189 




X 


HPC172 


X 




HPC178 




X 


HPC187 


X 


X 


HPC191 


X 


X 
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Tabello B UnvollatMndlge Amfnos4urdfi-8equonzen 



Katagorla: Obllqat esaentlelle Gene 



Gen-JD (Intern) 


AS-Po«ltlon' 


NS-Po«ttlon" 


HPC001 


26 


73 


HPC065 


360 


1078 


HPC066 


112 


334 


HPC074 


164; 185 


490; 493 


HPC084 


403: 600 


1207; 1498 


HPC104 


204 


610 


HPC155 


14 


41 


Kat«gorie: Fakultatlv essentlelle Gene 


GerMD (Intern) 


AS-Posltlon' 


N8-Po«itlon" 


HPC012 


180;236 


568; 703 


HPC013 


203; 207; 219 


607; 619; 655 


HPC036 


31 


91 


HPC048 


68; 397 


202: 1169 


HPC066 


6; 7 


18; 19 


HPC068 


381:388 


1141; 1166 


HPC060 


144; 146; 165; 168; 189 


430; 442: 463: 502; 506 


HPC078 


176; 


626 


HPC101 


133; 162 


397:484 


HPC107 


221:291 


881: 871 


HPC137 


327 


979 


HPC14S 


279 


835 


HPC180 


181." 191;209 


541; 671; 826 



1 Position der fehlenden Amlnosdure In der abgeleiteten AminosSuren Sequenz 

2 Position In der Nukleinsauran-Sequenz, erst© Base vom kodlerenden Baaen-Triplett. 
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Ein weiterer Aspekt der vorliegenden Erfindung ist ein Vektor, der eine 
erfindungsgemafce Nukleinsaure oder einen Abschnitt davon enthalt. Die 
Nukleinsaure oder der Nukleinsaureabschnitt kann so in den Vektor kloniert 
sein, daS sie entweder in Sense- oder Antisense Richtung exprimiert werden 
kann. Der Nukleinsaureabschnitt hat bevorzugt eine Mindestlange von 15 
Nukleotiden, starker bevorzugt 20 Nukleotiden, starker bevorzugt 50 
Nukleotiden. Dieser Vektor kann ein beliebiger prokaryontischer oder 
eukaryontischer Vektor sein, auf dem sich die erfindungsgemaSe DNA- 
Sequenz vorzugsweise in Verbindung mit Expressionssignalen befindet, wie 
z.B. Promoter, Operator, Enhancer etc. Beispiele fur prokaryontische 
Vektoren sind chromosomale Vektoren, wie etwa Bakteriophagen (z.B. 
Bakteriophage A) und extrachromosomale Vektoren wie etwa Plasmide, 
wobei zirkulare Vektoren besonders bevorzugt sind. Geeignete 
prokaryontische Vektoren sind z.B. bei Sambrook eta/., Molecular Cloning 
(1987), Kapitel 1-4, beschrieben. Andererseits kann der erfindungsgemaSe 
Vektor auch ein eukaryontischer Vektor sein, z.B. ein Hefevektor oder ein 
fur hohere Zellen geeigneter Vektor (z.B. ein Plasmidvektor, virafer Vektor, 
Pf lanzenvektor) . Derartige Vektoren sind beispielsweise bei Sambrook et al 
supra, Kapitel 16 beschrieben. CAI- und SRM-Vektoren, wie oben 
beschrieben, sind ebenfalls Gegenstand der Erfindung. 

Ein weiterer Gegenstand der vorliegenden Erfindung ist eine Zelle, die mit 
einem erfindungsgemaSen Vektor oder einer erfindungsgemaften 
Nukleinsaure transformiert ist. In einer bevorzugten Ausfuhrungsform ist 
diese Zelle eine prokaryontische Zelle, vorzugsweise ein gram-negatives 
Bakterium, z.B. E.coli. Andererseits kann die erfindungsgema&e Zelle jedoch 
auch eine eukaryontische Zelle sein, wie etwa eine Pilzzelle, eine Hefezelle, 
eine tierische oder eine pflanzliche Zelle. Besonders bevorzugt handelt es 
sich bei der Zelle urn einen Mikroorganismus, z.B. Helicobacter oder 
Salmonellen. Mit CAI- oder SRM-Vektoren transformierte Mikroorganismen 
sind oben bereits beschrieben worden. Diese sind, wie auch mit den obigen 
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Verfahren herstellbare Mutantenbanken, ebenfalls Gegenstand der 
Erfindung. 

Ein weiterer Aspekt der Erfindung betrifft ein essentielles und bevorzugt 
sekretiertes Polypeptid von H. pylori. Insbesondere ist dies ein Polypeptid, 
das 

(a) eine der in SEQ ID NO: m, wobei m eine gerade ganze Zahl von 2 bis 
246 einschliefclich ist, dargestellten Aminosauresequenzen oder 

(b) eine mit einer der Sequenzen gemafc (a) immunologisch 
kreuzreagierende Sequenz umfalSt. 

Unter immunologische kreuzreagierenden Sequenzen sind somit auch 
Muteine, Varianten und Fragmente der in den SEQ ID NO. 2 bis 246 
dargestellten Sequenzen umfa&t. Darunter sind Sequenzen zu verstehen, die 
sich durch Substitution, Deletion und/oder Insertion einzelner Aminosauren 
oder kurzer Aminosaureabschnitte von den obigen Sequenzen 
unterscheiden. 

Aufgrund von Homologieanalysen mit Hilfe des FASTA Proteinprogramms 
konnten den identifizierten Polypeptides deren Sequenz mit der 
Nukleinsauresequenz gefunden werden konnte, bestimmte Merkmale bzw. 
eine mutmalSliche Lokalisation im Bakterium zugewiesen werden. Einige der 
von den erfindungsgemafcen Nukleinsauren kodierten Polypeptide besitzen 
ein Signalpeptid und werden durch den Sec-abhangigen Transport- 
mechanismus an ihre Zielstelle exportiert, wahrend andere kein Signalpeptid 
besitzen und daher wahrscheinlich iiber einen Sec-unabhangigen 
Transportmechanismus, z.B. durch das ABC-Transporter-System, sekretiert 
werden (siehe Tabellen I und II). 

Ein weiterer Gegenstand der Erfindung ist ein Verfahren zur Herstellung der 
erfindungsgemalSen Polypeptide und -fragmente. Die Herstellung von 
erfindungsgemaRen Polypeptiden erfolgt vorzugsweise dadurch, date man 



WO 00/73502 



PCT7EP0O/05024 



- 58 - 

eine Zelie mit einem erfindungsgemafcen DNA-Molekul oder Vektor 
transformiert, die transformierte Zelle unter Bedingungen kultiviert, bei 
denen eine Expression des Polypeptids stattfindet, und das Polypeptid aus 
der Zelle oder/und aus dem Kulturuberstand isoliert. Dabei kann das 
erfindungsgema&e Polypeptid sowohl als Fusionspolypeptid als auch als 
Nichtfusionspolypeptid gewonnen werden. 

Das erfindungsgema&e Polypeptid kann als Immunogen zur Herstellung von 
Antikdrpern verwendet werden. 

Die vorliegende Erfindung betrifft somit auch einen Antikdrper, der gegen 
ein erfindungsgema&es Polypeptid gerichtet ist. Ebenfalls Gegenstand der 
Erfindung sind Fragmente solcher Antikorper, wie z.B. Fab-Fragmente oder 
Fc-Fragmente. 

Noch ein weiterer Aspekt der Erfindung ist ein Inhibitor der 
erfindungsgemaSen Polypeptide, deren Fragmente, bzw. deren Expression, 
Presentation oder/und naturlichen Funktion. Dies ist bevorzugt ein Molekul, 
welches in der Lage ist, spezifisch an ein Polypeptid oder Fragment davon 
zu binden oder/und dessen Expression, Presentation oder/und naturliche 
Funktion zu beeinflussen. Die Identifizierung von solchen spezifischen 
Bindepartnern wurde oben bereits beschrieben. Besonders geeignet als 
Inhibitoren sind Proteine oder Peptide, die ein erf indungsgema&es Polypeptid 
in seinen naturlichen Funktion hemmen, z.B. konnen Enzyme durch 
Blockieren des aktiven Zentrums gehemmt werden. 

Noch ein weiterer Aspekt der vorliegenden Erfindung betrifft eine 
pharmazeutische Zusammensetzung, die als Wirkstoff ein 
erfindungsgemaSes DNA-Molekul, einen erfindungsgemaSen Vektor, eine 
erfindungsgemaSe Zelle, ein erfindungsgemaftes Polypeptid, einen 
erfindungsgemaBen Antikdrper oder Fragment davon oder/und ein 
inhibitorisches Molekul, das in der Lage ist, spezifisch an ein 
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erf indungsgema&es Polypeptid zu binden, gegebenenf alls zusammen mit ub- 
lichen pharmazeutischen Hilfs-, Verdunnungs-, Zusatz- und Tragermitteln 
enthalt. 

Eine erfindungsgema&e pharmazeutische Zusammensetzung kann auf ver- 
schiedene Art und Weise und unter Verwendung einzelner ihrer Bestandteile 
als wirksarne Substanzen zur Hemmung der Reproduktion von Helicobacter 
Organismen in einem Wirt, speziell im Menschen verwendet werden. 

Die erfindungsgemaSe pharmazeutische Zusammensetzung kann einerseits 
zur Diagnostik einer HelicobacterAni ektion verwendet werden. Die 
Diagnostik auf Nukleinsaureebene erfolgt vorzugsweise durch Verwendung 
von Hybridisierungssonden, bzw. Primern, welche eine spezifische DNA- 
Sequenz aufweisen, die zu mindestens einen Abschnitt einer der in SEQ ID 
NO. 1 bis 245 (ungerade Zahlen) dargestellten Sequenzen komplementar ist, 
so daft sie eine Amplifikation der erfindungsgemafSen Sequenzen erlauben. 
Wie bereits erwahnt, konnen diese Amplifikationsprimer oder Sonden auch 
zur Amplifikation und damit zur Detektion von verwandten Mikroorganismen 
verwendet werden, wenn diese Gensequenzen aufweisen, die fur dasselbe 
essentielle Gen kodieren. Auf Proteinebene erfolgt die Diagnostik 
vorzugsweise mit Hilfe der erfindungsgemafSen Antikorper. 

Des weiteren ist die pharmazeutische Zusammensetzung zur Prophylaxe und 
Bekampfung von /ye//co£acfeHnfektionen und Infektionen mit verwandten 
Mikroorganismen geeignet. 

Ein weiterer wichtiger Aspekt der vorliegenden Erfindung ist die 
Verwendung der identifizierten essentiellen Gene von Helicobacter pylon r zur 
Prevention oder Bekampfung einer Infektion mit Helicobacter oder 
verwandten Mikroorganismen. Insbesondere konnen diese identifizierten 
essentiellen Gene zur Herstellung von Impfstoffen (Vakzinen) verwendet 
werden (siehe oben). 
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Eine weitere Verwendung der Polypeptide der Erfindung besteht in der 
Aufreinigung der Antikorper gegen H. pylori Polypeptide und gegen 
entsprechende Polypeptide aus verwandten und anderen Mikroorganismen. 

Die Erfindung wird durch die nachfolgenden Beispiele, Abbildungen und das 
Sequenzpro'tokoll naher erlautert. Im Sequenzprotokoll sind die in den 
Tabellen I und II aufgelisteten Nukleinsaure- und Aminosauresequenzen 
dargestellt. 

Abbildung 1 zeigt eine schematische Darstellung eines CAI-Vektors. 

Abbildung 2 zeigt eine schematische Darstellung eines Verfahrens 



der konditionalen Antisense-Hemmung (CAI). 



Abbildung 3 



zeigt eine schematische Darstellung der Untersuchung 
der Lebendfahigkeit von defizienten Mikroorganismen 
anhand ihrer Uberlebensraten mit Hilfe des CIA- 



Verfahrens. 



Abbildung 4 



zeigt eine schematische Darstellung des subtraktiven 
CAI-Verfahrens (CAI). 



Abbildung 5 



zeigt eine schematische Darstellung eines SRM-Vektors, 



Abbildung 6 



zeigt eine schematische Darstellung der reversiblen 
Inaktivierung eines Gens durch die Insertion/Excision 
eines konditional replizierenden SRM-Plasmids. 



Abbildung 7 



zeigt eine schematische Darstellung eines SRM- 
Verfahrens. 
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zeigt eine schematische Darstellung der Anreicherung 
von Fragmenten essentieller Gene durch subtraktive 
Hybridisierung. 



Abbildung 9 



zeigt eine Ubersichtskarte von pSRM4. Der "origin of 
replication" (ori) ist als Balken, kodierende Regionen 
(nahere Erlauterungen s. unten) sind als Pfeile 
dargestellt. Singulare Restriktionsschnittstellen sind 
angegeben. 



Abbildung 10 



zeigt eine Schematische Darstellung der Integration und 
Exzision eines pSRM Plasmids, das ein Insert mit 
Homologie zu einem Gen des Empfangerorganismus 
tragt. Die Doppelpfeile zeigen die 
Gleichgewichtsreaktionen zwischen Integration und 
Exzision. Gestrichelte Linien deuten auf den DNA- 
Bereich, in dem homologe Rekombination stattfindet. 



Abbildung 1 1 



zeigt eine schematische Ubersicht uber die Schritte zur 
Konstruktion einer zufalligen Fragmentbank. 



Abbildung 12 



zeigt die vollstandige Nukleotid- und 
Aminosauresequenz der Genfusion des HPC001 - 
Proteins mit dem RGS - His 4 -Epitop. Die 
Vektorsequenzen sind schwarz unterlegt. 



Abbildung 13 



zeigt die Nukleotidsequenz des SRM-Vektors pRSM4. 



Abbildungen 14 und 15 zeigen die Nukleotid- und Aminosauresequenzen 

weiterer essentieller Helicobacter-Gene. 
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Beispiele 
Beispiel 1 

Identifizierung essentieller Gene durch Herstellung gendefizienter 
Mikroorganismen durch subtraktive Rekombinations-Mutagenese (SRM) 

Die Anwendung des dargestellten Gesamtverfahrens ist exemplarisch am 
Beispiel des Pathogens Salmonella dargestellt, laBt sich jedoch auch mit 
anderen pathogenen Keimen, z.B. Helicobacter, durchfuhren. 

Das SRM-Verfahren wird mit dem Vektor pSRM4 durchgefuhrt, der speziell 
fur dieses Verfahren entwickelt wurde (siehe Abbildung 9, Sequenz siehe 
SEQ ID No.: 247 

Das Plasmid weist folgende Eigenschaften auf : 

pSRM4 tragt eine temperatursensitive Replikationsfunktion {repA xs , ori + ) 
aus dem Streptococcus Plasmid pWV01 (Kok, et aL, 1984; Maguin, etaL, 
1992) und repliziert bei permissiver Temperatur (30°C) in Gram-negativen 
Bakterien (E. co/i, Salmonella, u.a.) und in Gram-positiven Bakterien 
(Bacillus, Lactococcus, Streptococcus, u.a). Auf Grund des 
Replikationsmechanismus ("rolling circle" Mechanismus) ist es moglich, 
dass das Plasmid ebenso in Helicobacter pylori wie auch in Mycobakterien 
repliziert (del Solar, et aL, 1993; Kleanthous, et aL, 1991). 
Zum Test der Stabilitat von pSRM4 bei 30°C in E. coll oder Salmonella 
werden die Bakterien Qber Nacht bei 30°C in Flussigmedium (FIMed) mit 
Tetrazyklin (Tet) (1 7.5 //g/ml) angezogen, 1 :100 in mit Tet verdunnt, nach 
3 Stunden Inkubation bei 30°C nochmals 1 :10 3 in FIMed verdunnt (tO) und 
anschliessend bei 30°C ohne Tet inkubiert. Zu verschiedenen Zeitpunkten 
werden Aliquots der Kultur entnommen und in geeigneten Verdunnungen 
auf Festmedium (FeMed) mit und ohne Tet ausplattiert. Nach Inkubation bei 
30°C werden die Koloniezahlen auf beiden Medien b stimmt und die Anzahl 
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an Klonen pro ml Kultur berechnet. Die Anzahl Tet resistenter und Tet 
sensitiver Klone ist bis zu 7 Stunden nach tO identisch, nach 19 Stunden 
sind noch ca. 10% der Klone resistent gegen Tet. 

Bei 37 °C repliziert pSRM4 weder in Salmonella noch in E. coli. 
Das Experiment wird wie unter (1 ) durchgefuhrt mit dem Unterschied, dass 
die Inkubation bei 37°C (ohne Tet) stattfindet. Nach 80 bis 180 Minuten 
nach tO beginnt die Zahl an Tet sensitiven Klonen logarithmisch 
anzusteigen, wahrend die Anzahl an Tet resistenten (plasmidhaltigen) 
Klonen gleich bleibt. 

pSRM4 codiert fur eine Tetrazyklin Resistenz, die Resistenz gegen 1 7,5 //g 
Tetrazyklin/ml vermittelt. Das Tetrazyklin-Resistenzgen kann gegen andere 
Resistenzgene ausgetauscht werden. Dazu stehen innerhalb des Vektors 
mehrere Restriktionsschnittstellen zur Verfugung (s. Abb. 9). 

pSRM4 enthalt eine sog. "multiple cloning site" (mcs) mit verschiedenen, 
singularen Erkennungssequenzen fur Restriktionsenzyme. 

Die mcs liegt in einem Teil des lacZ Gens, das zur alpha-KompIementation 
in E. coli- Stammen wie DH5a, XL1-Blue, oder EC101 (Law, eta/., 1995) 
verwendet werden kann. Dadurch konnen Plasmide, die klonierte DNA 
Fragmente in der mcs tragen, durch blau/weiss-Unterscheidung auf 
Festmedium mit X-Gal (80 /vg/ml) und IPTG (420 //M IPTG) identifiziert 
werden. Klone von EC101, die Plasmide mit Inserts tragen, bilden weisse 
Kolonien, wahrend Kolonien von Klonen, die Plasmide ohne Insert enthalten, 
blau sind. 

pSRM4 lasst sich mit einer Effizienz von 2x10 7 bis 2x10 8 pro/yg DNA in E. 
coli DH5a bzw. EC101, und mit einer Effizienz von von 5x10 6 ///g in S. 
typhimurium ATCC14028 transformieren. Die Transformation erfolgt uber 
Elektroporation nach Standardprotokollen. 
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pSRM4 rekombiniert nicht mit dem Genom von S. typhimurium. 
pSRM4 wurde in S. typhimurium ATCC14028 transformiert; die 
Transformanten wurden 48 h bei 30°C auf FeMed mit Tet kultiviert und 
vereinzelt. Eine Einzelkolonie (ca. 10 s Zellen) wurde in einem ml FIMed 
resuspendiert und in entsprechenden Verdunnungen auf FeMed mit Tet bei 
30°C zur Bestimmung der Gesamtzellzahl bzw. bei 37°C zur Bestimmung 
der Anzahl der Integranten inkubiert. Unter 1x1 0 s Zellen der 
Ausgangskolonie wurde kein Klon gefunden, der bei 37 °C Kolonien bildet. 
Die Haufigkeit der nicht-homologen Rekombination des Plasmids mit dem 
Genom von S. typhimurium betragt demnach weniger als 1x10" 8 . 

pSRM4 mit kurzen genomischen Inserts eignet sich zur Inaktivierung von 
genomischen Genen uber homologe Rekombination (Beispiele: phoP Gen 
und phoN Gen aus S. typhimurium). 

Interne Fragmente der Gene phoP (561 bp) bzw. phoN (543 bp) wurden in 
pSRM4 kloniert. Die entsprechenden Plasmide (pSRM4-p/7oP bzw. pSRM4- 
phoN) wurden in S. typhimurium ATCC14028 transformiert und die 
erhaltenen Klone bei 30°C mit Tet selektioniert. Zwei Kolonien wurden in 
mehreren Verdunnungen auf BCiP-haltige Minimalmediumplatten ausplattiert 
und bei 30°C und bei 37 °C inkubiert. Kolonien, die bei nicht-permissiver 
Temperatur (37 °C) wachsen, bestehen aus Zellen mit genomisch 
integriertem Vektor. Diese Kolonien zeigen keine bzw. nur eine schwache 
Blaufarbung, da durch die Insertion des Vektors pSHM-phoN bzw. pSRM4- 
phoP das fur die saure Phosphatase PhoN codierende Gen phoN bzw. 
dessen Aktivatorgen phoP inaktiviert werden und damit keine Umsetzung 
des Farbstoffes BCiP erfolgen kann. Aus den erhaltenen Werten errechnen 
sich durchschnittliche Rekombinationsraten von ca. 3,6x1 0' 4 . Diese 
Rekombinationsraten wurden auch fur kurzere genomische Fragmente von 
bis zu 100 bp Lange beobachtet. 
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Bei 37 °C wachsende Klone werclen auf homologe Rekombination unci 
Integration des Plasmids in das Genom uberpruft. Zum Nachweis der 
Integration werden PCR-Reaktionen mit einem PCR-Primer, der mit 
Sequenzen des Plasmids hybridisiert, und einem phoN-bzw. phoP- 
spezif ischen Primer, der zu einer chromosomalen p/?oA/-bzw. phoP-Sequenz, 
nicht aber zum klonierten phoN-bzw. p/?oP-Fragment homolog ist, 
durchgefuhrt (Primerpaare phoNfor [GCTGTCGACTTTCTACCACTGATCGTAGC] / 
lacZ2 [CATGCCATGGCTGCGCGTAACCACC] bzw. phoP3 
[CCCCAAAGCACCATAATCAACGC] / lacZ1 [CATGCCATGGAAGAGCGCCCAATAC]) . 

Amplifiziert wird DNA von dem Plasmid zusammen mit einem Stuck 
chromosomaler DNA, die benachbart zur Insertionsstelle liegt. Bei 
genomischer Integration des Plasmids werden grosse Mengen an PCR 
Fragment erhalten. Zur Uberprufung des Verlusts an freier Plasmid-DNA 
dient eine PCR mit den Primern lacZ1 / SRMgb2 [ATACCGTCGACCTCGAG] . 
Beide Primer hybridisieren nur gegen Sequenzen des Plasmids, die sich 
seitlich zu dem klonierten Insert bedinden; bei genomisch integriertem 
Plasmid ergibt diese Amplifikation nur ein eine sehr geringe Menge an 
Produkt. 

Genomisch integriertes pSRM4 exzisiert bei permissiver Temperatur. 
Klonierte genomische Inserts konnen uber PCR mit verschiedenen 
Primerpaaren (SRMgb2/SRMgb4 [AACAAAAGCTGGGTACC]; lacZ1 /SRMgb2) 
leicht prapariert werden. 

Integrantenstamme (S. typhimurium ATCC14028-Derivate mit Integration 
von pSRM-phoN) werden auf FeMed mit Tet bei 30°C und bei 37 °C 
inkubiert und anschliessend kolonieweise unter Verwendung verschiedener 
Verdiinnungen bei beiden Temperaturen auf FeMed mit oder ohne Tet 
ausplattiert, um die Haufigkeit der Exzision zu quantifizieren. Der Quotient 
aus der Kolonienzahl auf FeMed ohne Tet und derjenigen auf FeMed mit Tet 
gibt an, in wieviel Zellen einer Kolonie das Plasmid frei vorliegt im Vergleich 
zu Zellen mit genomisch integri rtem Plasmid- Der Quotient ist ein Mass fur 
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die Exzisionsrate. Je nach Ausgangskolonie ergeben sich Exzisionsraten von 
3,2 bis 17,1. 

Exzisiertes Plasmid wird wiederum unter Verwendung der Primer SRMgb2 
und SRMgb4 oder der Primer lacZ1 und SRMgb2 in einer PCR 
nachgewiesen. Es ergeben sich grosse Mengen an PCR Produkt. 

Bei der Insertion und Exzision von pSRM4-fra^me/7f uber homologe 
Rekombination handelt es sich um eine Gleichgewichtsreaktion (siehe Abb. 
10). Bei 30°C ist das Gleichgewicht zur Seite des frei in der Zelle 
replizierenden Plasmids verschoben, bei 37°C liegt vor allem genomisch 
integriertes Plasmid vor. Sowohl bei 30°C als auch bei 37°C kann freies 
und integriertes Plasmid uber PCR nachgewiesen werden. Die jeweiligen 
Mengenverhaltnisse sind aber entsprechend der Temperatursensitivitat des 
Plasmids verschoben. 

Eine Mutante, die pSRM4-phoP im phoP Gen enthalt, ist in einem 
Zellkultursystem stabil und attenuiert. 

Zur Uberprufung der Stabilitat und Attenuierung einer pSRM4-p/?oF Mutante 
wird die intrazellulare Vermehrung dieser Mutante in murinen J774A.1 
Makrophagen mit der Vermehrung von pSRM4-p/7o/V, mit dem Wildtyp S. 
typhimurium ATCC14028, und mit stabilen phoP und phoN Mutanten 
verglichen. Dazu werden 4x1 0 5 Makrophagen der Zellinie J774A.1 mit 
8x1 0 6 Bakterien eines Klons bei 37°C, 5% CO z infiziert. Nach 30 min 
werden die extrazellularen Bakterien durch Waschen mit PBS sowie durch 
die Zugabe von 10 //g/ml Gentamicin zum Medium entfernt. Zu 
verschiedenen Zeitpunkten nach Infektion werden die Makrophagen mit 
0,5% Natriumdesoxycholat lysiert und geeignete Verdunnungsstufen des 
Zelllysats auf FeMed ausplattiert. Nach Inkubation werden die Koloniezahlen 
bestimmt und die Anzahl an Bakterien pro ml Kultur berechnet. Wahrend 
sich der wildtypische Stamm uber einen Zeitraum von 7 bis 24 Stunden 
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deutlich in den Makrophagen vermehrt, ist eine stabile phoP Mutante stark 
attenuiert. Eine stabile phoN Mutante und eine pSRM4-p/?o/V 
Insertionsmutante verhalten sich wie der Wildtyp. Eine pSRM4-phoP 
Insertionsutante verhalt sich wie die stabile phoP Mutante. Die 
Vermehrungsraten sind in nachfolgender Tabelle zusammengefasst 



Tabelle III: 

Stabilitat und Attenuierung von pSRM-lnsertionsmutanten unter Selektion 
in Makrophagen. 
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pSRM4 eignet sich zur Konstruktion von SRM rPCR Fragmentbanken. 

Die rPCR (random PCR) Fragmentbanken werden auf folgende Art 
hergestellt: 

1. ) Amplifikation von zufallig erzeugten -500 bp Fragmenten 

Nach dem "random Annealing" von Random-Primer OL-30N8 
[AAGTCGACGGATCCGGTACCTNNNNNNNN; N = A, T, G, oder C; unterstrichen: 
/Cpnl-Restriktionsschnittstelle] an gescherte chromosomale DNA von S. 
typhimurium ATCC14028 (400 ng) werden die Primer mittels Klenow- 
Polymerase verlangert (s. Abb. 11); die DNA wird aufgereinigt und einer 
PCR mit dem Primer OL-30 [AAGTCGACGGATCCGGTACCT] unterworfen. 
Fragmente von ca. 500 bp werden aus einem Agarose-Gel eluiert, 
aufgereinigt und zur erneuten Amplifikation mit dem Primer OL-30 
eingesetzt. Dieser Schritt wird wiederholt. Das genaue Protokoll ist der Tab. 
IV zu entnehmen; das Prinzip des Verfahrens ist in Abb. 1 1 illustriert. 

2. ) Ligation und Erstellung der Fragmentbank 

Spaltung der eluierten genomischen Fragmente mit Kpn\ und Ligation mit 
dephosphoryliertem, Kp/7l-restringiertem pSRM4. Transformation in £. coii 
EC101 oderS. typhimurium ATCC1 4028. Selektion der Transformanten auf 
FeMed mit Tet bei 30°C. 

3. ) Test der Fragmentbank mittels PCR und blau/weiss-Selektion 
Bestimmung des Hintergrundes an religiertem Vektor mittels Kontroll- 
Ligationen und mittels blau/weiss-Selektion auf FeMinimalmedium mit BCiP 
(40 //g/ml). PCR von klonierten Inserts mit Primer lacZ1 und SRMgb4. Der 
Hintergrund an religiertem Vektor liegt nach PCR-Detektion und Auswertung 
der blau/weiss-Selektion bei etwa 10-25% 

Tabelle IV: 

Reaktionsbedingungen zur Konstruktion einer zufalligen Fragmentbank 
mittels rPCR. 
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Tabelle IV; Reaktionsbedingungen zur Konstruktioii einer zufalligen Fragmentbank mittels 
rPCR. 



Klenow Reaktion 


Konzentraaon 


fcndJconzencration 


Menge [ulj 


Fnmer (OUgo iUiNS) 


10 ,uM = 10 pmol/ul 


0,4 uM 


2 


KJenow-^utler 


10 x 


Ix 


2 


KJenow 


2.5 U/ul 






dNTPs ' 1 


1.25 mM 


Z00 uM 


Jo 


1 emplateigescherte chromosomale 
DNA 




400 ag/Aosatz 




ri,U 




ad 20 


aues bis aut KJenow zusanimenpipetaeren 

1 94°C zur Denaturierung, dann auf Eis zur Vermeidung von Rehybridisierung 
5\25°C zum Annealing 
Zugabe von Klenow 
Inkubation 37°C, 2' 




Aufreinigung aus 1,3% Agarose Gel mit GFX Geleluuons-Kit 
Elution der DNA in 20 + 10 ul H 2 Q; DNA-Konzentrationsbestirnmung 





l.PCR 


Konzentranon 


£ndkonzentraaon 


Menge (.uij 


franer (Ohgo 30) 


10 uM 


0,8 uM 


4 


Putier ' ~ ■ 


10 x 


1 X 




uNiFs 


1.25 mM 


200 uM 


8 


iemplate: (irdssenrxaJcGomerte DNA 
aus Klenow Reaktion 






10 


ia^-Polymerase 


5 U/ul 




0.4 


H 2 0 






adM) 


Zugabe des Fnmers erst nacn erstern FCK-Zyiclus 
I. PCR: 95°Q 1 50°C, 1'; 72°C, 2'; 1 x 
Zugabe des Primers 
- H. PCR: 94°C, 40"; 64°C, 45"; 72°C, 1'; 10 x 
HI. PCR: 94°C ? 35"; 60°C, 45"; 72°C, 1'; 20 x 
Aufreinigung aus 1,3% Agarose Gel mit GFX Gelelutions-Kit 
Elution der DNA in 20 + 10 ul H 2 Q; DNA-Konzentrationsbestiinmung 



2. PCR 


Konzentranon 


Endkonzentrauon 


Menge [ulj 


iTimer (<Ji-j0) 


10 uM=10 pmoyul 


0.8 uM 


4 


IU x Hurler 




Ix 


5 






i mM 




dNTPs 


1.25 mM 


200 uM 


a 


i emplate: GrossentraJmonierte DNA 
aus l.PCR 


10-50 ng 






iia^-i'olymerase 


5 U/ul 




0.3 


H,0 






ad iO 


- ^CK-Reakaon: 94 U C, 5; i>4 u C, J5 ; 60 U C, 45' ; V2 U C, I ; 25 x. 

Auftrag auf 1.3%iges Agaxose-Gel und Elution des Bereiches um 550 bp. 
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SRM Fragmentbanken werden zur Konstruktion von SRM Mutantenbanken 
verwendet. 

SRM Fragmentbanken, die in E.coli EC101 kloniert wurden, werden in S. 
typhimurium ATCC 14028 transformiert. Die Transformanten werden bei 
30°C auf FeMed mit Tet selektioniert. Die erhaltenen Kolonien werden von 
den Platten in FIMed mit Tet abgeschwemmt. Zur Reduktion der Menge an 
Zellen mit freiem Plasmid wird die Bakteriensuspension 3 Stunden bei 37°C 
inkubiert, und anschiiessend auf FeMed mit Tet ausplattiert. Auf diese Art 
werden Tausende von genomischen Insertionsmutanten erhalten, die in ihrer 
Gesamtheit die SRM Mutantenbank darstellen. Um die Redundanz der SRM 
Mutantenbank zu verringern, wird von mehreren unabhangigen 
Konstruktionen der SRM Fragmentbank ausgegangen, von denen 
unabhangige Mutantenbanken erzeugt werden. Es werden jeweils 96 SRM 
Mutanten in einem Pool vereinigt. Diese 96 Mutanten eines SRM Pools 
konnen auch als einzelne Klone durch Tiefkiihlung konserviert werden. 

SRM Mutantenbanken werden negativ selektioniert. 
Die SRM Mutantenbank von S. typhimurium wird in J774A.1 Makrophagen 
oder in BALB/c Mausen selektioniert (es konnen auch andere Zelllinien und 
andere Mausstamme verwendet werden). Dabei wird jeweils 1 Pool (96 
Mutanten) selektioniert. Nach der Selektion werden die Bakterien zunachst 
auf FeMed mit Tet bei 37 °C kultiviert. Durch diesen Schritt vermehren sich 
nur diejenigen Klone, die genomisch integriertes pSRM Plasmid enthalten. 

Wiedergewinnung von SRM Fragmenten aus genomisch integrierten SRM 
Mutantenbanken. 

Die Exzision der integrierten SRM Plasmide aus dem Genom erfolgt durch 
Inkubation in FIMed mit Tet bei 30°C. Plasmide, die aus einem 
selektionierten Pool von SRM Mutanten gewonnen wurden, werden als 
"Driver" bezeichnet. Plasmide, die aus dem identischen aber nicht 
selektionierten Pool stammen, ergeben den "Tester". Die Plasmid DNA wird 
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fur Tester und Driver durch Plasmidpraparation aus den Bakterien 
gewonnen. 

Einzelne DNA Fragmente, die in pSRM4 kloniert sind, konnen nach 
Amplifikation von Tester und Driver Fragmentbanken uber PCR durch 
genetische Subtraktion identifiziert werden. 
Die SRM Fragmente der selektionierten Klone aus einem 96er Pool werden 
fur die Tester Gruppe durch PCR mit dem Primerpaar SRMgb2 / SRMgb4 
amplifiziert. Fur die Driver Gruppe werden diese Fragmente mit gleichen 
Primern amplifiziert, wobei die Primer zur Amplifikation der Driver DNA am 
5'-Ende und am 2. Nukleotid nach dem 5'-Ende biotinyliert sind. Die 
Randsequenzen der Tester-DNA-Fragmente konnen durch eine 
anschliessende Restriktion mit Kpn\ eliminiert werden, so dass 
Hybridisierungen uber die homologen Primersequenzen ausgeschlossen 
wird. 

Fur die Subtraktion werden biotinylierte Driver-DNA und Tester-DNA in 
Verhaltnissen von 10:1 bis 1000:1 gemischt. Die DNA dieser Ansatze wird 
prazipitiert, in 10 Fl Hybridisierungspuffer (0,05 M HEPES pH7,5, 1mM 
EDTA, unterschiedliche NaCI Konzentration) geldst, zunachst fur 3 Minuten 
bei 95°C inkubiert, gefolgt von einer 18stundigen Inkubation bei 65°C. Die 
wahrend dieser Hybridisierung gebildeten biotinylierten Homo- und 
Heterodimere werden uber Streptavidin-gekoppelte magnetische Partikel aus 
dem Ansatz extrahiert. Um die Effizienz der Extraktion von homologen 
Driver-DNA-Fragmenten aus der Tester-DNA zu erhohen (Anreicherung der 
zu identifizierenden Tester-DNA-Fragmente), wird die Subtraktion zwei bis 
dreimal wiederholt. 

Fur die Isolierung und anschliessende Identifizierung der angereicherten 
Tester-DNA-Fragmente werden diese uber die /Cp/7l-Schnittstelle in den 
pSRM4-Vektor kloniert. 
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Identifizierung von SRM Fragmenten durch Southern (Dot) Blot. 
Als Alternative zur genetischen Subtraktion kann ein Blotting Verfahren 
angewendet werden, um SRM Fragmente von essentiellen Genen zu 
identifizieren. Dazu werden die SRM Fragmente aus jeweils 96 SRM 
Mutanten mit freien pSRM Plasmiden uber PCR (Primer SRMgb2 / SRMgb4) 
amplifiziert und einzeln auf einem Membranfilter fixiert. Als Sonde zur 
Hybridisierung werden (1 ) PCR-amplifizierte SRM Fragmente aus dem Driver 
und (2) PCR-amplifizierte SRM Fragmente aus dem Tester verwendet. DNA 
Fragmente, die mit der Sonde aus dem Driver, aber nicht mit der Sonde aus 
dem Tester ein Signal ergeben, sind die gesuchten Fragmente essentieller 
Gene. 

Subtraktive Rekombinations-Mutagenese in Helicobacter 
Das SRM Verfahren kann in alien Organismen angewendet werden, in denen 
pSRM4 eine temperatursensitive Replikation zeigt. Daruberhinaus kann das 
SRM Verfahren fur andere Organismen wie z.B. Helicobacter spp., 
Campylobacter spp., oder andere adaptiert werden, indem SRM Vektoren 
fur diese Organismen konstruiert werden. Um den SRM Vektor z.B. fur 
Helicobacter spp. zu adaptieren wird von einem Piasmid ausgegangen, dass 
in Helicobacter spp. repliziert, z.B. pHel (Heuermann und Haas, 1995; 
Heuermann und Haas, 1998). Das Piasmid repliziert wie pSRM nach dem 
"rolling circle" Mechanismus, und die RepA Proteine beider Proteine sind 
homolog (del Solar, et al. t 1993; Kleanthous, et aL, 1991). Von dem 
Piasmid wird entsprechend dem von Maguin et al. beschriebenen Verfahren 
(Maguin, etal., 1992) eine termperatursensitive Variante hergestellt. Dazu 
wird das Piasmid nach Standardmethoden in vitro mit Hydroxylamin 
mutagenisiert und bei permissiver Temperatur in H. pylori transformiert. 
Alternativ wird nur das repA Gen mutagenisiert und die mutagenisierte DNA 
anschliessend in ein rep/l-freies Piasmid kloniert. Durch Replika-Plattierung 
von H. pylori Klonen, die mutagenisiertes Piasmid bzw. repA enthalten, und 
Selektion der Klone mittels einer plasmid-kodierten Antibiotikaresistenz 
werden Varianten des Plasmids bzw. repA Gens identifiziert, die eine 
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Replikation bei 30 C, aber nicht bei 37 °C erlauben. Die Mutation(en), die 
die Temperatursensitivitat vermitten, werden durch Sequenzierung des 
Plasmids (bzw. des repA Gens) identifiziert. Die Temperatursensitivitat des 
Plasmids wird weiterhin wie oben fur pSRM4 beschrieben charakterisiert. 
Das Plasmid wird im Folgenden wie pSRM4 als Vektor fur die Subtraktive 
Rekombinationsmutagenese in Helicobacter spp. eingesetzt. 

Beispiel 2 

Identifizierung essentieller Gene durch Herstellung gendefizienter 
Mikroorganismen durch konditionale Antisense-Hemmung (CAI) 
Das CAI Verf ahren kann mit verschiedenen Vektoren durchgefuhrt werden, 
die in dem zu untersuchenden Organismus replizieren uhd selektioniert 
werden konnen. Beispielhaft ist im Folgenden die Durchfuhrung des 
Verfahrens in Salmonella typhimurium beschrieben. Als Vektor wird pCAI 
verwendet. pCAI enthalt die Replikations- und Resistenzfunktionen von 
pWSK29 (Wang und Kushner, 1 991 ), oder von pBluescript, oder von pUC, 
oder von anderen Plasmiden. Der jeweilige Vektor enthalt einen 
regulierbaren CAI Promoter sowie dessen c/s- und frans-regulatorische 
Komponenten. Die Transkription von diesem Promoter wird durch exogene 
Faktoren (Induktoren) gesteuert. Bei dem regulierten CAI Promoter handelt 
es sich um den tet Promoter, der durch den tef-Operator und den Tet- 
Repressor nur in Anwesenheit von Tetrazyklin im Wuchsmedium aktiviert 
wird (Hillen und Berens, 1994). Alternativ wird der ara Promoter 
verwendet, der uber den ara-Operator und AraC, ein Aktivator Protein 
gesteuert wird und nur in Anwesenheit von Arabinose im Wuchsmedium 
aktiviert wird (Guzman, etal. , 1 995) . Grundsatzlich kann auch jeder andere 
durch exogene Signale regulierbare Promoter, verwendet werden. 
Stromaufwarts von der regulatorischen Sequenz des CAI Promoters werden 
mehrere Terminator Strukturen (Wilson und von Hippel, 1 995; Yarnell and 
Roberts, 1 999) eingefiigt, die die transkriptionelle Aktivitat von Sequenzen 
stromaufwarts des Promoters in Abwesenheit des Induktors unterdrucken. 
Stromabwarts von dem CAI Promoter konnen ein oder mehrere RNA- 
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stabilisierende Elemente (RSE) eingefiigt werden (Carrier und Keasling, 
1 997a; Carrier und Keasling, 1 997b; Carrier und Keasling, 1 999). Die RSE 
werden so kloniert, dass sich nach der Insertion von CAl Fragmenten am 5'- 
und/oder am 3'-Ende der transkribierten RNA Fusionen mit den RSE 
ergeben. Zwischen dem Promoter und der 5'-RSE Sequenz einerseits und 
der 3'-RSE Sequenz andererseits werden eine Kpn\ und andere 
Restriktionsschnittstellen (mcs) eingefiigt, die spater zur Insertion von CAl 
Fragmenten verwendet werden. 

In dem CAl Vektor wird eine Bank mit genomischen Fragmenten des zu 
untersuchenden Organimus konstruiert. Dazu werden in die mcs 
genomische DNA Fragmente kloniert, die nach dem in Beispiel 1 
beschriebenen rPCR Verfahren prapariert wurden. 

Die so erhaltene CAl Genbank wird in den zu untersuchenden Organismus 
transformiert und einzelne Klone werden uber den Plasmid-kodierten 
Resistenzmarker selektioniert. 

Das CAl Verfahren kann mit verschiedenen Selektions- und/oder Screening 
Verfahren angewendet werden, die nachfolgend beschrieben sind. Die 
Funktionalitat der einzelnen Screening Verfahren wird jeweils mit einem 
bestimmten Gen demonstriert. Dazu werden das aroA Gen, das phoP Gen, 
und das phoN Gen aus typhimurium verwendet. Zunachst werden 
Fragmentbanken von (1) dem aroA Gen, (2) dem phoN Gen, und (3) dem 
phoP Gen in pCAl konstruiert- Zur Konstruktion dieser Fragmentbanken 
werden die genomischen Bereiche dieser Gene einschliesslich benachbarter 
Sequenzen von ca. 500 bp auf jeder Seite des Gens durch PGR amplifiziert. 
Die so erhaltenen PCR Produkte werden als Template fur die Erzeugung von 
rPCR Fragmenten nach dem oben beschriebenen Verfahren verwendet. Die 
rPCR Fragmente werden ohne Fraktionierung verschieden langer DNA 
Fragmente oder in verschiedenen Gruppen mit unterschiedlichen Langen 
(durch Gelelution fraktioniert) in die Kpn\ Schnittstelle in der mcs von pCAl 
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kloniert. Die so erhaltenen Fragmentbanken werden in S. typhimurium 
transformiert und auf den pCAi-kodierten Resistenzmarker selektioniert. Die 
drei Banken werden dann auf folgende Art getestet: 

(1) aroA Fragmentbank - Identifizierung von Klonen durch fehlendes 
Wachstum auf Nahrmedium: 

Die Klone der aroA Fragmentbank werden auf Platten mit Festmedium (M9 
Minimalmedium mit Casaminoacids [CAA, Aminosaure Mischung] ohne 
Induktor) plattiert. Die Funktion des aroA Gens ist notwendig, damit sich die 
Bakterien auf M9 ohne CAA vermehren konnen. Die erhaltenen Kolonien 
werden durch RepKka-Plattierung auf M9 mit CAA und auf M9 ohne CAA, 
jeweils mit Induktor, ubertragen. Klone, bei denen Fragmente der aroA 
Fragmentbank in antisense Orientierung von dem CAI Promoter transkribiert 
werden und RN A synthetisieren, die das genomische aroA Gen translationell 
inhibieren, vermehren sich auf M9 mit CAA mit Induktor aber nicht auf M9 
ohne CAA mit Induktor. Klone, die sich auf M9 ohne CAA nicht vermehren, 
werden isoliert und weiter analysiert. 

(2) phoN Fragmentbank - Identifizierung von Klonen durch geanderte 
biochemische (Farb)-Reaktion auf Festmedium: 

Die Klone derphoN Fragmentbank werden durch Replika-Plattierung auf M9 
Medium mit BCiP und mit Induktor, und auf M9 mit BCiP ohne Induktor 
ubertragen. Durch die Aktivitat von PhoN wird BCiP zu einem blauen 
Farbstoff umgesetzt. Klone, in denen die Translation des phoN Gens durch 
asRNA inhibiert werden, bleiben auf M9 Medium mit BCiP mit Induktor 
weisslich, wahrend sie sich auf M9 Medium mit BCiP ohne Induktor blau 
verfarben. 

(3) phoP Fragmentbank - Identifizierung von Klonen aus negativ 
selektionierten Pools: 

Die Funktion des phoP Gens ist notwendig, damit sich die Bakterien in 
Makrophagen vermehren konnen. Die Klone der phoP Fragmentbank werden 
in einem Pool zusammengefasst. Der Pool wird in zwei identische Gruppen 
g teilt, die in J774A.1 Makrophagen passagiert werden. Fur die ein 
Gruppe wird wahrend der Infektion Induktor zu dem Kulturmedium der 
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Makrophagen zugesetzt. Die zweite Gruppe wird in J774A.1 Makrophagen 
ohne zugesetzten Induktor passagiert. (Beschreibung des 
Infektionsexperiments siehe Beispiel 1 .) Nach der Infektion (Dauer zwischen 
7 und 24 Stunden) werden aus beiden Ansatzen die pCAl Plasmide 
prapariert. Die CAI Fragmente beider Ansatze werden durch PCR mit 
Primern, die benachbart zu den klonierten Fragmenten auf dem pCAl Vektor 
hybridisieren, amplifiziert und anschliessend durch genetische Subtraktion 
(siehe Beispiel 1) voneinander getrennt. Fragmente, die zur Inaktivierung 
von phoP fuhren, werden so isoliert. 

(4) Anwendung der Tests 1-3 auf eine genomische Fragmentbank: 
Das CAI Verfahren wird dann mit einer kompletten genomischen 
Fragmentbank in S. typhimurium angewendet. Die Klone mit der CAI 
Fragmentbank werden nach den oben beschriebenen drei Verfahren (1-3) 
getestet. 

Beispiel 3 

Anreicherung von H. pylori Genen, kodierend fur sekretierte/exkretierte 
Polypeptide 

Herstellung einer H. pylori Genbank im Minimalvektor pMin2: 

Als Ausgangsstamm dient der H. pylori Wildtyp Stamm 69A. Die Bakterien 
werden auf Serumplatten (s. Westblom et al., 1991) bei einer Temperatur 
von 37°C in einer Atmosphare von 5% 0 2 , 10% C0 2 , 85% N 2 angezuchtet. 
Die Isolierung der chromosomalen DNS erfolgt nach der Methode von Leying 
et al. (1992), wobei die DNS abschlieSend iiber einen Casium-Chlorid- 
Gradienten aufgereinigt wird. 50 pg der gereinigten, chromosomalen DNS 
wird mit den Restriktionsendonukleasen Sau3A und Hpall partiel! gespalten, 
die DNS-Fragmente in einem Agarosegel aufgetrennt und die Fragmente in 
einer Grosse von 3 bis 6 kbp aus dem Gel mit Hilfe des Geneclean II Kits 
(Bio101) eluiert. Die isolierten DNS-Fragmente werden in den Bglll und Clal 
geschnittenen pMin2-Vektor (Kahrs et al., 1995) kloniert und uber 
Elektroporation in den E. coli-Stamm E181 transformiert, dem zuvor das 
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Plasmid pTnMax9 ubertragen wurde. Insgesamt werden (iber einen solchen 
Ansatz ca. 4000 Klone generiert. Der E. coli-Stamm E1 81 ist ein Derivat des 
Stammes HB101 (Boyer und Roulland-Dussoix, 1969) und enthalt den 
lysogenen /l-Phagen /ICH616 zur Replikation des pTnMax9-Plasmids. 

Serumplattenrezeptur 

36 g GC-Agar (Basis) in 910 ml Aqua dest. suspendieren und autoklavieren 
(-) auf ca. 45 °C abkuhlen lassen 
{-) Zugabe von 10 ml Vitaminmix 

(-) Zugabe von jeweils 1 ml der Antibiotikastammlosung 

(-) Vancomycin (10 mg/l in Aqua bidest) 

(-) Nystatin (0,793 mg/l in DMF) 

(-) Trimethoprim (5 mg/l in DMF) 

(-) Amphotericin (5mg/l in DMF) 

*DMF = Dimethylformamid 
(-) Zugabe von 90 ml Serum oder 
(-) Zugabe von 8 % Pferdeblut = 80 ml 
(-) oder gleiche Menge Humanblut 



Herstellung der Komponenten: 
Antibiotika-Stammlosunqen 



Vancomycin 100 mg in 10 ml Aqua bidest 

Nystatin 7,93 mg in 10 ml DMF je 1 ml pro Liter GC-Agar 

Trimethoprim 50 mg in 10 ml DMF zusetzen 

Amphotericin 50 mg in 10 ml DMF 

(Lagerung im Kuhlschrank 
bis max. 8 Wochen) 



Vitaminmix (Konzentrat) 

Dextrose (D-Glucose) 100 g 

L- Glut ami n 10 g 

Cystein HC1 (CjH,NO a S x HC1 x HaO) 26 g 
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Uracil 



L-Cystein <C 6 H 12 N 3 0 4 S 3 ) 
Adenin 



DPN NAD 



Vitamin B- 



Guanin CI 



Co carboxylase 
Fe (N0 3 ) 3 
Thiamin HC1 



12 



100 mg in 50 ml 

20 mg Aqua bidest losen 
3 mg 
2 50 mg 
10 mg 
1,1 g 

1, 0 g in 15 ml HC1 
30 mg (32%ig) losen 
500 mg 



L-Arginin HC1 

p -Aminobenzoesaure 



150 mg (sterilf iltrieren, in 10 ml 
13 mg Portionen abfullen + einfrieren) 



Genetische Anreicherung sekretierter/exkretierter H. pylori Genprodukte: 
Das auf pTnMax9 liegende Transposon TnMax9 ist mit dem genetischen 
Markerjff-Lactamase ausgestattet. Dieser Marker ist auf dem Transposon so 
angelegt, dass damit die Selektion erfolgreicher Transposon-lnsertionen 
ermoglicht wird, wenn dieses im korrekten Leserahmen solcher Gene 
vorliegt, deren Produkte von E. co//-Stamm E1 45 rif sekretiert bzw. exportiert 
werden. Die Insertion des Transposons in ein solches Gen fuhrt zu einer 
Genfusion zwischen dem Zielgen und dem Marker, wobei durch ein im 
Zielgen determiniertes Sekretions- und/oder Exportsignal das Fusionsprotein 
aus der Zelle geschleust wird und die Aktivitat des integralen Reportergens 
entfaltet wird. Im Fall der ^-Lactamase konnen die Klone direkt uber die 
Entwicklung einer Resistenz gegen Ampicillin nachgewiesen werden. Das 
TnMax9 Transposon auf pTnMax\9 wird uber IPTG aktiviert. 

Die Transposon-Mutagenese der Genbank wird in Pools von bis zu 20 
Einzelklonen durchgefuhrt. Die jeweiligen Pools werden auf LB-Platten 
ausplattiert, die mit 1 00 /iM IPTG, 1 5 /yg/ml Chloramphenicol und 1 5 //g/ml 
Tetrazyklin versetzt sind. In einem zweiten Schritt werden die JnMax9 
mutagenisierten pMin2-Plasmide uber Konjugation in den E. colt Stamm 
E145 rif uberfuhrt, da diese mit einem entsprechenden mob-Signal (or/7) 
ausgestattet sind. Die pTnMaxS-Plasmide werden dagegen nicht ubertragen. 
Folglich kommt es in E. ca//E145 rif zu einer spezifischen Vervielfaltigung der 
mutagenisierten pMin2 Genbank. Die entsprechenden Transkonjuganten 
werden auf LB-Medium mit 1 5//g/ml Chloramphenicol, 1 5//g/ml Tetrazyklin 
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and 100 //g/ml Rifampicin selektioniert. Insgesamt werclen 500 - 1000 
Transkonjuganten in 2 ml LB-Medium zusammengefasst und in 
entsprechenden Verdunnungen (10* 1 - 10" 2 ) auf LB-Platten angezuchtet, die 
mit 50 /yg/ml Ampicillin versetzt sind. Nach einer Kultivierung der Platten 
uber 36 Stunden bei 37 °C erhalt man im gesamten Ansatz 200 - 300 
Ampicillin-resistente Klone mit Transposon inserierten Plasmiden. 

Herstellung gendef izienter H. pylori, die in sekretierte/exkretierte Polypeptide 
kodierende Gene mutiert sind und die Identifizierung solcher Gene mit 
essentieller biologischer Funktion. 

Herstellung gendefizienter H. pylori Mutanten: 

Durch Einbringung der gewonnenen Plasmide mit den TnMaxS-mutierten H. 
pylori Genen, kodierend fur sekretierte/exkretierte Polypeptide in einen H. 
pylori Wildtyp Stamm konnen Gen-spezifische Mutanten erzeugt werden. 
Bedingt durch die klonierten H. pylori Gensequenzen auf den Plasmiden 
kommt es im Falle eines doppelten homologen Rekombinationsereignisses 
zu der genomischen Insertion des TnMaxS-Transposons in das 
chromosomale Zielgen und damit zu dessen Inaktivierung. Durch den 
genetischen Marker auf dem Transposon kann dieser Vorgang selektioniert 
werden, da das pMin2 Plasmid in H. pylori nicht repliziert wird. 

In der Durchfuhrung wird der H. pylori Wildtyp Stamm 69A in 
Einzelansatzen mit den gewonnenen individuellen Plasmiden transformiert, 
wobei die naturliche Kompetenz des Bakteriums, DNS aufzunehmen, 
ausgenutzt wird (Haas et al., 1993). Ausgehend von einer Vorkultur auf 
Serumplatten entsprechend den Standard Kultivierungsbedingungen, werden 
die Bakterien in BHI-Medium aufgenommen und bis zu einer optischen 
Dichte bei 550 nm von 0,1 bei 37°C unter mikroaerophilen Bedingungen 
angezuchtet. Die einzelnen Kulturansatze werden jeweils mit 100 bis 500 
ng gereinigte Plasmid-DNS versetzt und die Kultur uber Nacht fortgesetzt. 
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Charakterisierung der biologischen Funktion der gendefizienten H. pylori 
Mutanten im Wachstumstest: 

Die einzelnen Ansatze werden nach der Kultivierung auf Serumplatten 
ausplattiert, welche mit 4 //g/ml Chloramphenicol versetzt sind. Hinsichtlich 
der Wachstumseigenschaften der einzelnen Mutanten im Vergleich zum 
Wildtyp Stamm konnen 3 Kategorien unterschieden werden: (1) Mutanten, 
die nicht wachsen; (2) Mutanten, die kleinere Kolonien ausbilden; (3) 
Mutanten, die eine normale Koloniegrosse entwickeln. Diese Ergebnisse 
konnen fur jedes -Ausgangsplasmid reproduzierbar erzielt werden. Zur 
eindeutigen Beurteilung der biologischen Bedeutung der gendefizienten 
Mutanten der Kategorie 1 werden diese dem CAI-Verfahren zugefuhrt. Die 
gendefizienten Mutanten der Kategorie 2 und 3 werden in den anderen 
biologischen Testsystemen analysiert. 

Beispiel 4 

Ermittlung der Identitat der H. pylori Gene kodierend fur 
sekretierte/exportierte Polypeptide. 

Zur Ermittlung der Primarstruktur der identifizierten H. pylori Gene, werden 
die jeweiligen Ausgangsplasmide aus dem E. coli Stamm verwendet. Die 
Plasmide werden aus diesen Stammen isoliert und die Nukleotidsequenzder 
Zielgene durch Sequenzierung der Bereiche oberhalb und unterhalb der 
Insertionsstelle des Transposons im Zielgen bestimmt. Das Leseraster des 
Zieigens kann direkt ermittelt werden, da das Transposon-kodierte ss- 
Laktamase Gen eine aktive Fusion mit dem Genprodukt des Zieigens eingeht 
(s.o.). Die Sequenzierung wird mit Hilfe eines ABI-Sequenz-Automaten nach 
Angaben des Herstellers mit f olgenden Sequenzprimern durchgef uhrt: M 1 3- 
F (GTAAAACGACGGCCAGT) und M13-RP1 (CAGGAAACAGCTATGACC 
). Zur weiteren Charakterisierung der Gene wird die Datenbank Genebank 
des GCG-Programms herangezogen, z.B. zur Identifizierung bekannter, 
homologer Gene anderer Mikroorganismen (FASTA), zur Identifizierung 
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potentieller Signalpeptidbereiche (SPSCAN) oder zur Identifizierung von 
Upoproteinen (MOTIFS). 

Bei einem Teil der identifizierten Klone konnte nicht die vollstandige 
Gensequenz ermittelt werden, da das klonierte DNS-Fragment nicht das 
gesamte Gen enthielt. Das verfiigbare DNS-Fragment wird dazu eingesetzt, 
um aus der Original-Genbank ein DNS-Fragment mit vollstandigen Gen zu 
isolieren. Aus diesen Klonen konnen dann mit einem Gen-spezifischen 
Primer und einem Vektor-spezifischen Primer die fehlenden Gensequenzen 
arnplifiziert und anschliessend direkt sequenziert werden. Hierzu wird 
chromosomale DNS aus dem H. pylori Stamm 69A isoliert, 25-35 jjg davon 
partiell mit Bsp143l (Sau3AI-lsoschizomer) verdaut und entstehende 
Fragmente einer Grosse von 2 bis 8 kbp isoliert. Zur Klonierung wird der 
Vektor pACYCI 84 mit BamHI geschnitten, mit Shrimp Alkaline Phosphatase 
dephosphoryliert und anschlie&end mit den isolierten Fragmenten ligiert. 
Nach Transformation in den E. colt Stamm 0466 und Selektion auf 30//g/ml 
Chloramphenicol werden 5560 Einzelkolonien isoliert und mit Hilfe der 
Polymerase Kettenreaktion analysiert. 

Aus den bekannten Genfragmenten werden hierbei mdglichst nahe 
benachbart zum fehlenden Genstuck Primer fiir eine Produktgrosse von 
kleiner/gleich 700 bp abgeleitet. Mit diesen Primern werden 
Amplifikationsprodukte hergestellt, welche einen Klon enthalten, der beide 
Primer-Bindungsstellen umfasst. Aus den positiven Klonen werden 
anschliessend die Plasmide isoliert, welche entweder durch Sequenzierung 
oder durch Dot Blot Analyse verifiziert werden. 
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Sequenzierung 

Zur Vervollstandigung der DNS-Sequenz von Genen, die nach den 
Sequenzreaktionen mit den Universalprimern M13F und M13RP1 nicht 
vollstandig bestimmt werden kann, wird die Technik des Primer-Walkings 
verwendet. Dazu wird ein etwa 50 bis 200 bp stromaufwarts des 3'-Endes 
des bekannten Sequenzabschnitts bindendes Oligonukleotid abgeleitet und 
als Primer fur eine weitere Sequenzreaktion nach dem Dye-Terminator- 
Prinzip (Amersham Pharmacia Biotech) eingesetzt. Am Beispiel der 
vollstandig bestimmten DNS-Sequenz des Gens hpc052 von H. pylori 
69Awird dies durch die Oligonukleotidprimer Mu052a (5'- 
AGGCTAAAGACGTGTTAG-3')undMu052b(5'-CTAGCGTGGAATTAGCC- 

3') erreicht. 

Expressionsklonierung 
Zur Charakterisierung der Genprodukte der identifizierten Gensequenzen 
werden die Gensequenzen heterolog in attenuierten Salmonella- 
Vakzinstammen exprimiert. Hierzu wird das Polymerase-Promotor-System 
des Bakteriophagen T7 (Tabor & Richardson 1985) verwendet. Das 
auszupragende Gen wird durch Polymerase-Kettenreaktion (PGR) mit 
spezifischen Oligonukleotidprimern aus chromosomaler DNS amplifiziert. Die 
Auswahl der genspezifischen Oligonukleotidprimer erfolgt abhangig von der 
Prasenz eines Signalpeptids zur Sec-abhangigen Translokation des 
Genprodukts ins Periplasma. Liegt ein solches vor, wird das 
Oligonuklotidprimerpaarso gewahlt, dass ein Fragment des auszupragenden 
Gens amplifiziert wird, das fur das reife Protein ohne Signalpeptid kodiert. 
Liegt keine Signalsequenz vor, wird der gesamte offene Leserahmen 
amplifiziert. 

Die amplifizierten Genfragmente werden in einen von pBR322 abgeleiteten 
Plasmidvektor inseriert. Die Insertion erfolgt so, dass sich die klonierten 
Genfragmente jeweils als Fusion mit einem fur das Detektionsepitop 
RGSHis 4 kodierenden Sequenzabschnitt unter der transkriptionellen Kontrolle 



WO 00/73502 



PCT/EP00/05024 



- 84 - 

des Promotors des Bakteriophagen T7 befinden. Die Auspragung der 
Genprodukte wird im Salmonella typhimurium Vakzinstamm SL3261 ::pYZ84 
(Yan & Meyer 1996) untersucht der mit den auf o. g. Weise hergestellten 
Expressionsvektoren transformiert wird. Die Detektion der RGSHis 4 - 
Fusionsproteine erfolgt durch SDS-Polyacrylamid Gelelektrophorese (SDS- 
PAGE) und anschliessender Western-Blot-Analyse mit einem fur das 
RGSHis 4 -Epitop spezifischen monoklonalen Antikorper (RGS.His) 
Beispielhaft wird anhand der Gensequenz HPC0O1 eine 
Expressionsklonierung mit anschliessender Western Blot Analyse dargestellt. 
Hierfur wird das Genfragment des hpcOOl Gens, das fur das reife HPC001 
Protein kodiert (ohne Signalpeptid) mit Hilfe der Oligonukleotidprimer LAT50 
(5'-GATCAGATCTACATATGTTTATCATTCCCTCTCGC-3 # ) und LAT51 (5'- 
GATCGGTACCAAAACCTTAATGCGTTGCT-3') mittels PCR amplifiziert. Das 
0,9 kb grosse Amplifikat wird mittels Bgl\\ und Acc65\ hydrolysiert und in 
den mit BamH\ und Acc65\ hydrolysierten Vektor pLAT289 inseriert. Der 
resultierende Expressionsvektor pMSC34 kodiert fur ein Fusionsprotein, das 
aus dem hpcOOl Gen besteht, dem die Signalsequenz von HPC001 fehlt 
und dem RGSHis 4 -Epitop. Das Expressionsprodukt besitzt eine 
Molekulmasse von 34 kDa. 

Beispiel 5 

Biologisches Modell "kokkoide Helicobacter" 
Herstellung kokkoider Formen. 

Die experimentelle Uberf uhrung der spiralformigen Helicobacter Form in eine 
kokkoide Form kann auf unterschiedliche Weise erf olgen. Insbesondere kann 
die Umwandlung unter Stressbedingungen beobachtet werden, z.B. in 
Gegenwart subletaler Dosen eines wirksamen Antibiotikums, bei 
Substratmangel oder in einer Normalluft-Atmosphare. Der 
Umwandlungsprozess kann somit als Schutzreaktion der Bakterien 
verstanden werden. Tatsachlich kann man diese Formen auch im Gewebe 
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infizierter Menschen beobachten. Moglicherweise hanclelt es sich hierbei um 
eine Uberdauerungsform. Ein Wegfallen oder die verzogerte bzw. 
unvollstandige Auspragung dieser Eigenschaft, z.B. durch Wegfallen oder 
Inaktivierung eines Gens oder Genprodukts kann fur das Bakterium im 
Uberlebenskampf fatale Nachteile haben. 

Die experimented Umwandlung der spiralformigen Helicobacter in eine 
kokkoide Form wird in der Regel von einer frischen Plattenkultur gestartet, 
die unter idealen Bedingungen angezogen wurde (Serumplatten, 37°C, 
mikroaerophile Atmosphare (5% 0 2/ 10% C0 2/ 85% N 2 )) und somit 
uberwiegend spiralfdrmige Helicobacter enthalt. Im nachfolgenden Beispiel 
werden die abgeernteten Bakterien in ein Minimalmedium uberfuhrt, das sich 
aus Wasser, z.B. sterilisiertem Leitungswasser # und x% (v/v) einer 
komplexen Protein-Ldsung, z.B. foetalem Kalberserum (FCS) 
zusammensetzt. In Abhangigkeit von der FCS-Konzentration x bilden sich 
die Bakterien innerhalb weniger Stunden oder in mehreren Tagen vollstandig 
in kokkoide Formen um. Gangige Konzentrationen sind 10 - 30% (v/v) FGS 
in Wasser. In der ublichen Anordnung werden die Bakterien in definierter 
Anzahl, z.B. bei einer OD 550 von 0.2, in 5 ml Minimalmedium bei 37°C in 
einem Zellkulturschrank kultiviert, wobei der C0 2 Anteil in der Luft auf 1 0% 
eingestellt wird. Der fortschreitende Entwicklungsprozess wird einerseits 
mikroskopisch und durch Wachstumsbestimmungen dokumentiert. 
Mikroskopisch wird im Phasenkontrast die Morphologie (kokkoid _ 
spiralformig) und die Beweglichkeit {kokkoid + unbeweglich; spiralformig 
+ beweglich; spiralformig + unbeweglich) der Bakterien im Kulturansatz 
anteilig bestimmt, z, B. in einer Zahlkammer. Gegebenenfalls werden 
spezifische Farbungen durchgefuhrt um auch strukturelle Anderungen, z.B. 
in der Bakterienhulle, indirekt zu erfassen bzw. den Anteil toter Keime zu 
bestimmen. Da kokkoide Formen auf herkommlichen Medien, z.B. Serum- 
Platten nicht wachsen, kann zu unterschiedlichen Zeitpunkten der Anteil 
vitaler bzw. noch reaktivierbarer Zustandsformen (colony forming units; 
CFU) anteilig ermittelt werden. 
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R aktivi rung k kkoider F rm n. 

Die Aktivierung der kokkoiden Bakterien erfolgt in einem Medium, das in EP 
0900839 beschrieben ist. Die Bakterien werden in definierter Anzahl, z.B. 
500 - 1000 Bakterien, auf diesem Medium ausplattiert und unter 
mikroaerophilen Bedingungen bei 37 °C fur mehrere Tage bebrutet. Auch in 
diesem Ansatz wird der Entwicklungsprozess mikroskopisch (s.o.) und iiber 
die Bestimmung der CFU dokumentiert. 

Schliefclich konnen-diese Untersuchungen auch im Tiermodell durGhgefuhrt 
werden. Es ist anzunehmen, dass im Tier andere Reaktivierungs- und 
Selektionsmechanismen wirken als im oben dargestellten 
Kultivierungsmodell. Z.B. konnen andere oder zusatzliche Gene oder 
Gengruppen am ProzelS beteiligt sein. Die hergestellten kokkoiden Formen 
werden in definierter Anzahl, z.B. 10 8 Bakterien, einer Maus, z.B. Balb/c, 
oral in einer wassrigen Losung verabreicht, z.B. mit einer Magensonde. 
Nach einer bestimmten Zeit, z.B. nach 2 - 4 Wochen werden die infizierten 
Tiere getotet, der Magen entnommen, vom Inhalt befreit und histologisch 
und durch Wachstumstests (s.o.) auf Besiedlung untersucht. In der 
histologischen Untersuchung kann der Anteil kokkoider und spiralformiger 
Bakterien bestimmt werden. Das Experiment sollte bevorzugt mit 
Helicobacter-Stammen des Typus I durchgefuhrt werden, da die Stamme 
vom Typus II wenige.r virulent sind. 

Identifizierung essentieller Helicobacter Gene. 

Die beschriebenen biologischen Systeme (A + B) konnen z.B. zur Analyse 
definierter Helicobacter-Mutanten eingesetzt werden, welche iiber die 
beschriebenen Verfahren hergestellt wurden. Die Untersuchung erfolgt 
jeweils im Vergleich zum jeweiligen Wildtyp-Stamm. Ist eine Mutante z.B. 
nicht in der Lage, sich zur kokkoiden Form umzuwandeln oder bleibt eine 
Reaktivierung der kokkoiden Form aus oder treten die Umwandlungen mit 
grolSen zeitlichen Verzogerungen auf, kann fur das mutierte Gen eine 
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fakultativ essentielle Funktion abgeleitet werden. Bei der Reaktivierung 
kokkoider Formen im Tiermodell konnen pro Versuchsansatz mehrere 
Mutanten gleichzeitig eingesetzt werden, z.B. 10 Stamme. Voraussetzung 
ist, dass die Wiedererkennung dieser Stamme im Gewebe durch geeignete 
Verfahren sichergestellt ist, z.B. durch entsprechende PCR-Verfahren oder 
durch in situ Hybridisierung. 
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Anspruche 

1 . Verfahren zur Bereitstellung von Mitteln zum Nachweis, zur 
Prevention oder/und zur Therapie von mikrobiellen Infektionen, 
dadurch gekennzeichnet, 

dafc es die Schritte umfafSt: 

(A) Identifizieren von essentiellen Genen und den entsprechenden 
Polypeptiden durch Herstellung gendefizienter Mikroorganismen 
durch konditionale Antisense-Hemmung (CAI) oder/und subtraktive 
Rekombinations-Mutagenese (SRM) und Bestimmung der Lebens- 
oder/und Uberlebensfahigkeit der gendefizienten Mikroorganismen 
in einem Testsystem. 

(B) Identifizieren von spezifischen Wirkstoffen, welche gegen die 
essentiellen Polypeptide gerichtet sind und die Inaktiviertung der 
Mikroorganismen oder verwendeter Mikroorganismen herbeifuhren, 

(C) Testen der identifizierten Wirkstoffe auf ihre Anwendbarkeit als 
Bestandteile von diagnostischen, praventiven oder/und 
therapeutischen Mitteln, 

(D) Formulieren der anwendbaren Wirkstoffe als diagnostische, 
preventive oder/und therapeutische Mittel. 

2. Verfahren nach Anspruch 1 , 
dadurch gekennzeichnet, 

da& obligat essentielle Gene durch CAI identifiziert werden. 

3. Verfahren nach Anspruch 1, 
dadurch gekennzeichnet, 

date fakultativ essentielle Gene durch SRM identifiziert werden. 



30 

4. 



Verfahren nach einem der vorhergehenden Anspruche, 
dadurch gekennz ichnet. 
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daB vor Schritt (A) eine Selektion auf Gene durchgefuhrt wird, die 
fur Polypeptide mit einer bestimmten Funktionalitat kodieren 
oder/und die fur Polypeptide kodieren, die in einer bestimmten 
Entwicklungsstufe exprimiert werden. 

5. Verfahren nach einem der vorhergehenden Anspruche, 
dadurch gekennzeichnet, 

daB die Selektion mit Hilfe von Hybridisierungsverfahren 
durchgefuhrt wird, ausgewahlt aus Subtraktions- und Array- 
Verfahren. 

6. Verfahren nach Anspruch 5, 
dadurch gekennzeichnet, 

daR die Selektion auf spezifische subtrahierte apathogene oder 
pathogene Gene durchgefuhrt wird. 

7. Verfahren nach Anspruch 5, 
dadurch gekennzeichnet, 

dafS die Selektion auf spezifische subtrahierte Gene von H. pylori 
oder H.heilmannii durchgefuhrt wird. 

8. Verfahren nach einem der Anspruche 4 bis 7, 
dadurch gekennzeichnet, 

da(5 fur exportierte Polypeptide kodierende Gensequenzen selektiert 
werden. 

9. Verfahren nach einem der Anspruche 4 bis 8, 
dadurch gekennzeichnet, 

dal3 fur sekretierte Polypeptide kodierende Gensequenzen selektiert 
werden. 

10. Verfahren nach einem der Anspruche 4 bis 9, 
dadurch gek nnz ichnet. 
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date fur Polypeptide kodierende Gene selektiert werden, welche zur 
Entwicklungdervitalen Form aus der Uberdauerungsformnotwendig 
sind. 

5 11. Verfahren nach einem der Anspriiche 4 bis 9, 
dadurch gekennzeichnet, 

daB fur Polypeptide kodierende Gene selektiert werden, welche zur 
Entwicklung der Oberdauerungsf orm aus der vitalen Form notwendig 
sind, 

10 

12. Verfahren nach einem der vorhergehenden Anspruche, 
dadurch gekennzeichnet, 

dali in Schritt (A) zur Bestimmung der Lebens- und 
Uberlebensfahigkeit der gendefizienten Mikroorganismen 
15 Testsysteme, ausgewahlt aus //7-Wfro-Systemen, 

Zellkultursystemen, Gewebekultursystemen und Tiermodellen als 
naturliche Umgebung verwendet werden. 



13. Verfahren nach Anspruch 12, 
20 dadurch gekennzeichnet, 

dafS diejenigen defizienten Gensequenzen, welche zu nicht 
kultivierbaren und in naturlicher Umgebung nicht uberlebensfahigen 
gendefizienten Mikroorganismen fuhren, der Kategorie der obligat 
essentiellen Gene zugeordnet werden. 

25 

1 4. Verfahren nach Anspruch 1 2, 
dadurch gekennzeichnet, 

daS diejenigen defizienten Gensequenzen, welche zu kultivierbaren 
aber in naturlicher Umgebung nicht uberlebensfahigen defizienten 
30 Mikroorganismen fuhren, der Kategorie der fakultativ essentiellen 

Gene zugeordnen werden. 
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15. Verfahren nach einem der vorhergehenden Anspruche, 
dadurch gekennzeichnet, 

daQ> die identifizierten Gene zur Herstellung von Primern verwendet 
werden, mit Hilfe derer entsprechende Gene aus verwandten 
5 Mikroorganisrnen, Subspezies oder/und Arten identifiziert werden. 

16. Verfahren nach einem der vorhergehenden Anspruche, 
dadurch gekennzeichnet, 

da(5 in Schritt (B) spezifische Wirkstoffe identifiziert werden, welche 
io die Expression, Presentation oder/und Funktion der essentiellen 

Polypeptide beeinflussen, insbesondere immunologisch wirksame 
Substanzen, Bindepartner der Polypeptide oder deren Fragmente 
oder/und inhibitorische Substanzen. 

15 17. Verfahren nach einem der vorhergehenden Anspruche, 
dadurch gekennzeichnet, 

daS Schritt (B) eine Bestimmung des immunogenen Potentials der 
Polypeptide oder/und deren Fragmente umfa&t, wobei die 
identifzierten Gene exprimiert werden und anschliefcend eine 
20 Western-Blot-Analyse durchgefuhrt wird oder/und date mit den 

identifzierten Polypeptiden oder Fragmenten davon eine 
Vakzinierung in Zellkultur oder im Tiermodell durchgefuhrt und die 
Auslosung einer spezifischen Immunreaktion beobachtet wird. 

25 18. Verfahren nach einem der vorhergehenden Anspruche, 
dadurch gekennzeichnet, 

daS Schritt (B) eine Bestimmung des Bindungspotentials der 
Polypeptide oder deren Fragmente durch Screening von 
Substanzenbibliotheken, Oberflachendisplayverfahren, kristallo- 
30 graphische Analyse oder/und Computer-Modelling umfafct. 



19. 



Verfahren nach einem der vorherg henden Anspruche, 
dadurch gekennz ichn t, 
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dafcdiediagnostischen, praventiven oder/und therapeutischenMittel 
in Form von passiven Impfstoffen oder aktiven Impfstoffen 
bereitgestellt werden. 

5 20. Verfahren nach Anspruch 1 9, 
dadurch gekennzeichnet, 

da(S die passiven Impfstoffe in Form von Antikorpern oder/und 
Antikorperfragmenten und die aktiven Impfstoffe in Form von 
heterologen Tragersystemen oder/und in Form von Antigenen, 
n0 Antigenfragmenten, Subunit-Vakzinen, Lebendvakzinen, DNA- 

Vakzinen oder/und Lebensmittelvakzinen bereitgestellt werden. 

21. Verfahren nach einem der vorhergehenden Anspruche 1 bis 19, 
dadurch gekennzeichnet, 

15 dafcdiediagnostischen, praventiven oder/und therapeutischenMittel 

inhibitorische Substanzen umfassen, insbesondere Expressionsinhibi- 
toren oder/und Enzyminhibitoren. 

22. Verfahren zur Identifizierung essentieller mikrobieller Gene, 
20 dadurch gekennzeichnet, 

dafc es die Schritte umfaBt: 

(i) Herstellen von gendefizienten Mikroorganismen, 

(ii) Bestimmen der Lebens- oder/und Uberlebensfahigkeit der 
gendefizienten Mikroorganismen aus (i), 

25 (iii) Identif izieren eines proteinkodierenden Abschnitts einer mikrobiellen 
DNA-Sequenz, in der die gendefizienten Mikroorganismen defizient 
sind. 

(iv) Charakterisieren derjenigen DNA-Abschnitte, die essentiell fur die 
Uberlebensfahigkeit sind. 

30 

23. Verfahren nach Anspruch 22, 
dadurch gekennzeichn t, 
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dafc die gendefizienten Mikroorganismen hergestellt werden, indem 
ein DNA-Abschnitt in einem mikrobiellen Genom mutagenisiert wird. 

24. Verfahren nach Anspruch 22, 
5 dadurch gekennzeichnet, 

daf£ der DNA-Abschnitt durch Transposon-Mutagenese 
mutagenisiert wird. 

25. Verfahren nach Anspruch 23, 
10 dadurch gekennzeichnet, 

da£ die Mutagenisierung des DNA-Abschnitts auf dem mikrobiellen 
Genom durch homologe Rekombination erfolgt. 

26. Verfahren nach Anspruch 25, 
is dadurch gekennzeichnet, 

da& das SRM-Verfahren angewendet wird. 

27. Verfahren nach Anspruch 23, 
dadurch gekennzeichnet, 

20 dalS die gendefizienten Mikroorganismen hergestellt werden, indem 

in Mikroorganismen ein DNA-Abschnitt oder eine Teilsequenz davon 
in Form von Antisense-RNA exprimiert wird. 

28. Verfahren nach Anspruch 27, 
25 dadurch gekennzeichnet, 

daB das CAI-Verfahren angewendet wird. 

29. Verfahren nach einem der Anspruche 22 bis 28, 
dadurch gekennzeichnet, 

30 daB zur Bestimmung der Lebens- oder/und Uberlebensfahigkeit der 

gendefizienten Mikroorganismen Testsysteme ausgewahlt aus In- 
wYro-Systemen, Zellkultursystemen, Gewebekultursystemen und 
Tiermodellen als naturliche Umgebung verwendet werden. 
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30. Verfahren nach Anspruch 29, 
dadurch gekennzeichnet, 

date diejenigen defizienten Gensequenzen, welche zu nicht 
5 kultivierbaren und in naturlicher Umgebung nicht uberlebensfahigen 

gendefizienten Mikroorganismen fuhren, der Kategorie der obligat 
essentiellen Gene zugeordnet werden. 

31 . Verfahren nach Anspruch 29, 
10 dadurch gekennzeichnet, 

daS diejenigen defizienten Gensequenzen, welche zu kultivierbaren 
aber in naturlicher Umgebung nicht uberlebensfahigen defizienten 
Mikroorganismen fuhren, der Kategorie der fakultativ essentiellen 
Gene zugeordnet werden. 

15 

32. Verfahren nach einem der Anspruche 22 bis 31, 
dadurch gekennzeichnet, 

dafc das Identifizieren des proteinkodierenden DNA-Abschnitts 
durch Expression in einem Wirtsorganismus und Nachweis des 
20 Vorhandenseins eines Expressionsproduktes erfolgt. 



33. Verfahren nach einem der Anspruche 22 bis 32, 
dadurch gekennzeichnet, 

dafc es weiterhin umfaSt: 

(v) Herstellen von Primern zur Amplifikation und Detektion von 
homologen Gensequenzen in heterologen Mikroorganismen 

(vi) Identifizieren der homologen Gensequenzen. 

34. Nukleinsaure, kodierend fur ein essentielles sekretorisches Gen aus 
Helicobacter, identifiziert durch das Verfahren nach einem der 
Anspruch 22 bis 33. 



35. 



Nukleinsaure nach Anspruch 34, 
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dadurch g kennz ichnet, 

daft sie fur ein sekretiertes Polypeptid mit Signalpeptid kodiert. 

36. Nukleinsaure nach Anspruch 34, 
dadurch gekennzeichnet, 

daft sie fur ein sekretiertes Polypeptid ohne Signalpeptid kodiert. 

37. Nukleinsaure, 
dadurch gekennzeichnet, 

daft sie 

(a) eine der in SEQ ID NO: n, wobei n eine ungerade ganze Zahl von 1 
bis 245 einschlieftlich darstellt, d a rg estel Iten 
Nukleinsauresequenzen, oder einen proteinkodierenden Abschnitt 
davon, 

(b) eine einer der Sequenzen aus (a) im Rahmen der Degeneration des 
genetischen Codes entsprechende Nukleotidsequenz oder 

(c) eine mit einer der Sequenzen aus (a) und/oder (b) unter stringenten 
Bedingungen hybridisierende Nukleotidsequenz umfaftt. 

38. Genbank, umfassend mindestens zwei Nukleinsauren nach einem 
der Anspruche 34 bis 37. 

39. Vektor, 

dadurch gekennzeichnet, 

daft er mindestens eine Nukleinsaure nach einem der Anspruche 34 
bis 37 oder einen Abschnitt davon enthalt. 

40. Vektor nach Anspruch 39, 
dadurch gek nnz ichn t, 
daft er ein CAI-Vektor ist. 

41 . Vektor nach Anspruch 39, 
dadurch gekennz ichnet. 
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daB er ein SRM-Vektor ist. 

42. Zelle, 

dadurch gekennzeichnet, 

daB sie mit einer Nukleinsaure nach einem der Anspruche 34 bis 37 
oder einen Vektor nach einem der Anspruche 39 bis 41 
transformiert ist. 

43. Mutantenbank, 
dadurch gekennzeichnet, 

daB sie aus mindestens zwei Mikroorganismen besteht, die mit 
einem Vektor nach Anspruch 40 oder einem Vektor nach Anspruch 
41 transformiert sind. 

44. Polypeptid, 

dadurch gekennzeichnet, 

daB es von einer Nukleinsaure nach einem der Anspruche 34 bis 37 
kodiert ist. 

45. Polypeptid nach Anspruch 44, 
dadurch gekennzeichnet, 

daB es 

(a) eine der in SEQ ID NO: m, wobei m eine gerade ganze Zahl von 2 
bis 246 einschlieSlich darstellt, dargestellten Aminosauresequenzen 
oder 

(b) eine mit einer der Sequenzen gemaB (a) immunologisch 
kreuzreagierende Sequenz umfaBt. 

46. Polypeptid nach Anspruch 45, 
dadurch gekennzeichn t, 

daB es ein essentielles sekretiertes Polypeptid ist. 



47. 



Polypeptidfragment, 
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dadurch gekennzeichn t, 

daB es einen immunogenen Abschnitt einer der Sequenzen nach 
Anspruch 45 aufweist. 

48. Inhibitorisches Moiekul, erhaltlich durch das Verfahren nach 
Anspruch 1 , 

dadurch gekennzeichnet, 

da(S es in der Lage ist, spezifisch an ein Polypeptid oder Fragment 
davon nach einem der Anspruche 44 bis 47 zu binden oder/und 
dessen Expression, Presentation oder/und naturliche Funktion zu 
beeinflussen. 

49. Verfahren zur Herstellung eines Polypeptids oder 
Polypeptidfragments 

nach einem der Anspruche 44 bis 47, 
dadurch gekennzeichnet, 

dafS man eine Zelle mit einer Nukleinsaure nach einem der 
Anspruche 34 bis 37 oder einem Vektor nach Anspruch 39 
transformiert, die transformierte Zelle unter Bedingungen kultiviert, 
bei denen eine Expression des Polypeptids stattfindet und das 
Polypeptid aus der Zelle oder/und dem Kulturiiberstand isoliert. 

50. Verwendung.eines Polypeptids oder eines Fragmentes davon nach 
einem der Anspruche 44 bis 47 davon als Immunogen zur 
Erzeugung von Antikorpern. 

51 . Antikdrper oder Fragment davon, 
dadurch gekennzeichnet, 

daS er spezifisch ist fur ein Polypeptid oder ein Fragment davon 
nach einem der Anspruche 44 bis 47. 

52. Pharmazeutische Zusammensetzung, 
dadurch g kennzeichn t, 
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daB sie als Wirkstoff 

a) eine Nukleinsaure nach einem der Anspruche 34 bis 37, 

b) einen Vektor nach Anspruch 39, 

c) eine Zelle nach Anspruch 42, 

d) ein Polypeptid oder ein Fragment davon nach einem der Anspruche 
44 bis 47, 

e) einen Antikorper oder Fragment davon nach Anspruch 51 und/oder 

f) ein inhibitorisches Molekul nach Anspruch 48, 
gegebenenfalls zusammen mit ublichen pharmazeutischen Hilfs-, 
Verdunnungs-, Zasatz- und Tragermitteln, enthalt. 

53. Verwendung einer pharmazeutischen Zusammensetzung nach 
Anspruch 52 zur Diagnostik, Prevention oder/und Therapie einer 
/ye//co/>3Cfe/--lnfektion. 

54. Verwendung einer pharmazeutischen Zusammensetzung nach 
Anspruch 52 zur Hemmung der Reproduktion von Helicobacter- 
Organismen und/oder anderen anthrogenen Mikroorganismen in 
einem Wirt. 

55. Verwendung nach Anspruch 54 # 
dadurch gekennzeichnet, 

dafc eine Nukleinsaure nach einem der Anspruche 34 bis 37 als 
DNA-Vakzin formuliert wird. 

56. Verwendung nach Anspruch 54, 
dadurch gekennzeichnet, 

daS ein Polypeptid oder Polypeptidfragment nach einem der 
Anspruche 44 bis 47 als Subunit-Vakzin oder als Lebendvakzin 
formuliert wird. 
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57. Verwendung einer pharmazeutischen Zusammensetzung nach 
Anspruch 52 zur HersteNung eines Mittels fur die Diagnostik, 
Prevention oder/und Therapie einer HelicobacterAni ektion. 

5 58. Vektor nach Anspruch 41 , 
dadurch gekennzeichnet, 

daS der SRM-Vektor der Vektor pSRM4 (SEQ ID No. 247) ist. 
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Fragmente aus CAI-Plasmiden 



Driver 



Tester 



Anreicherung der genomischen Fragmente 
essentieller Gene durch genetische 
Subtraktion 



Wonierung und Sequenzierung der 
angereicherten genomischen Fragmente 
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Genornische Oder subgenomische 
DNA Fragmente 
aus Pathogen 



Replikationsursprung 
(ori) fur einen Klonierwirt 




Konditional aktiver 
Replikationsursprung (ori) 
fur das Pathogen 



Seiektionlerbares 
Markergen 
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Permissive Bedingungen Nicht permissive Beclingungen 

= Plasmidreplikation = Keine Plasmidreplikation 
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Plasmid 



GENOM 
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Vermehrung 
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Rekombination 
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Tester-Pool 
(nicht selektioniert) 



Uberlebende 
selektionierte Mutanten 



Uberlebende Vy A 
nicht setektlonlerte 
Mutanten 





Driver 



Tester 



Genomische bzw. subgenomische 
Genbank im SRM Vektor fur 
genspezifische Insertionsmutagenese 



Ubertragung in cien zu untersuchenden 
Mikroorganismus 



Genomische Insertionsmutanten 



Gewinnung von Einzelklonen mit 
genspezifischen Insertionen gem. Abb. 3 
unter Bedingungen, bel denen die 
Plasmide nicht replizieren 



Zusammenfassung mehrere Einzelklone 
in Pools, die parallel getestet werden 



Selektion eines der beiden Pools auf 
uberlebensfdhige Klone (z.B. im Tier) 



Gewinnung der SRM-Plasmide aus 
beiden Pools durch Rezirkularisierung 
der Insereirten Plasmide unter Bedingungen, 
die die Plasmidreplikation erlauben 

PCR Amplifikation der genomischen 
Fragmente aus SRM Plasmiden 

Anreicherung der genomischen Fragmente 
essentleller Gene durch genetische 
Subtraktion 



Klonlerung und Sequenzierung der 
angereicherten genomischen Fragmente 
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Ligation der Tester DNA mit 
Adapter-OIigonukleotiden 



Mischen der Tester DNA mit einem 
molaren Uberschuss an Driver DNA 

Denaturierung und Rehybridisierung 
des Mischansatzes 



Auffullen der uberstehenden 
Einzelstrangenden 



lineare 
Amplifikation 



exponentielle ^_ 
Amplifikation 
= Anreicherung 




PGR Amplifikation mit Oligonukleotid- 
primem, komplementqr zu den 
Adaptersequenzen 

Anreicherung von Tester DNA mit 
Genen fur iebensnotwendige Funktion 



B 



Driver 




Extraktion 



Markierung der Driver DNA Fragmente 
mit Biotin 



Mischen der Tester DNA mit einem 
molaren Uberschuss an Driver DNA 

Denaturierung und Rehybridisierung 
des Mischansatzes 



Extraktion der biotinylierten Homo- und 
Heteroduplex DNA Fragmente mit 
Trdger-gekoppeltem Streptavidin 



Anreicherung von Tester DNA mit 
Genen fur Iebensnotwendige Funktion 
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Abb. 11 



A 

Zufallige Hybridisierung / \ v 

vonOL30N8mit =f X X 

genomischer DNA \ 



B 

Verlangerung der + M 

hybridisierten OL30N8 \ b \ 
Primer mit Klenow 

Polymerase \ _ a _ \ c 



C 

Hybridisierung der DNA 
Fragmente aus Reaktion 
B mit sich selbst und 
Verlangerung der 
Fragmente mit Taq 
Polymerase 



D 

Hybridisierung von OL30 
mit den DNA 
Fragmenten aus 
Reaktion C und PCR 



OL30 



Amplifikation der OL30 
Fragmente OL30 



c 
d 



E 

Restriktion der PCR 
Produkte aus Reaktion D 
mit Kpn\ und Klonierung 



inpSRM4 ^L^Kpni 
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GCGGGGTT CTCAXCAXCA TCATCATCAT GGIATGGCTA GCATGACTGG TGGACAGCAA ATGGGTCGGG AXCTGTAC 
S H H H H H H G M A SM T 6 GQQ MGR DL 



1 



81 
161 
241 
321 
401 
481 
561 
641 



CGAIGACGAT AAGGATCTAC AIAT 
P D D K D L H 



Stttat 

3 F 



TTGTCAAAAA 
F V K 

AACGGGCATT 
NGH 

CTATGTCAAA 
Y Y V K 

GCGGCACGGA 
S G T 



ATTTTCTTAC 
K F S Y 

TGATAGAGGG 
LIE 

AGGAATTTTG 
R N F 

CAAAACTTAC 
D K T Y 



GGCATCCCCA 
G I P 

GGATCGCCCT 
GDRP 

CTATTGGGGG 
A I G 

ATCGCTAAAC 
I A K 



CATTCCCTCT 
I I P S 

TTCCTAAAAT 
I P K 

AAACGCGGCG 
KRG 

CGATGAGGTG 
G D E V 

ATTACCCAGA 
HYP 



CGCTCTATGG TAGGCACGCT 
R S M V G T 

CCCATGGATT GAGCTTCCTG 
I P W I E L P 

AAGTGGTGGT GTTTATCCCT 
EVV VFIP 

TTATTCACTA * GTGAGGGGTT 
L F T S E G 

TGCTATGACT AAAGAATTTA 
D A M T KEF 



CTATGAGGGC GATATGCTCT 
L Y E G D M L 

TTATGCCTGA TTTTAAAAAT 
V M P D F K N 

CCCCATGAAA AAAAATCTTA 
PHE KKS 

TTATTTGCAC CCTTTTGAGA 
F Y L H P F E 

TGGGTAAAAT TTTTGTTTTA 
M G K I F V L 



AACCCTTATA 
N P Y 

TCAAGGCGCG 
T Q G A 

ATGAATTTTT 
D E F 



AAAGTAAGCA. 
K S K 

GAAGCTAATA 
E A N 

CATGATCGGC 
F M I G 



. T CCGGGTATC 
H P G I 

TCAGCATGCA 
ISM 

GATAACAGGG 
D N R 



CATTACCAAA 
H Y Q 

ACTCATTCAA 
Q L I Q 

ATAATTCTAG 
DNS 



AAGACAATGA AACCTTCCAT 
K D N E T F H 

ATGGAGGGCG AAAAGGTGTT 
MEG E K V 

CGACTCGCGC TTTTGGGGGA 
S D S R F W G 



TTAATGGAGp AGTTAGCCAC 
L M E Q L A 

TTATAAAAAA ATCAATGACG 
F Y K K I N D 

GTGTGGCTTA TAAAAATATC 
S V A Y K N I 



721 
801 
881 



GTGGGTTCGC 
V G S 

ACGCTATTTG 
K R Y L 

ATTAA 
H 



CATGGTTTGT 
P W F 

GTGCGTTGGG 
V R W 



TTATTTCAGT 
V Y F S 



AGCGCATGTT 
E R M 



TTGAGTTTAA 
L S L 



TAAAAGCGTT 
F K S V 



AAAATAGCCT GGAAATGGAT 
K N S L E M D 

G AAGGC T TAG AAAAAATCAT 
E G L E K I 



GCAGAAAATA ACCCCAAAAA 
A E N N P K 

TAAAAAAGAA AAAGCAACGC 
I K K E K A T 
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LOCUS pSRM4 

FEATURES Location/Qualifiers 

CDS complement (631.. 1821) 

/gene="tet" 
CDS complement (1964.. 2319) 

/gene="lacZ*" 
CDS complement (2653.. 3351) 

/gene="repAts" 
CDS complement (34 17.. 3578) 

/gene="ORF C" 
CDS complement (3619.. 3828) 

/gene="ORF B" 
BASE COUNT 993 a 978 c 899 g 1010 t 

ORIGIN 

1 CAAAATTGCA AGCAATTTTT AAAATCAAAC CCATGAGGGA ATTTCATTCC CTCATACTCC 
61 CTTGAGCCTC .CTCCAACCGA AATAGAAGGG CGCTGCGCTT ATTATTTCAT„ TCAGTCATCG 
121 GCTTTCATAA T C T AAC AG AC AACATCTTCG CTGCAAAGCC ACGCTACGCC AAGGGCTTTT 
181 ACGCTACGAT AACGCCTGTT TTAACGATTA TGCCGATAAC TAAACGAAAT AAACGCTAAA 
241 ACGTCTCAGA AACGATTTTG AGACGTTTTA ATAAAAAATC GCTAGTCCGA GGCCTCGACC 
301 CGATTCACAA AAAATAGGCA CACGAAAAAC AAGTTAAGGG ATGCAGTTTA TGCATCCTCG 
361 AGCCGCGGCT CGAGGGTGAT TCATTCTGCT AACCAGTAAG GCAACCCCGC CAGCCTAGCC 
4 21 GGGTCCTCAA CGACAGGAGC ACGATCATGC GCACCCGTGG CCAGGACCCA ACGCTGCCCG 
4 81 AGATGCGCCG CGTGCGGCTG CTGGAGATGG CGGACGCGAT GGATATGTTC TGCCAAGGGT 
541 TGGTTTGCGC ATTCACAGTT CTCCGCAAGA ATTGATTGGC TCCAATTCTT GGAGTGGTGA 
601 ATCCGTTAGC GAGGTGCCGC CGGCTTCCAT TCAGGTCGAG GTGGCCCGGC TCCATGCACC 
661 GCGACGCAAC GCGGGGAGGC AGACAAGGTA TAGGGCGGCG CCTACAATCC ATGCCAACCC 
721 GTTCCATGTG CTCGCCGAGG CGGCATAAAT CGCCGTGACG ATCAGCGGTC CAGTGATCGA 
781 AGTTAGGCTG GTAAGAGCCG CGAGCGATCC TTGAAGCTGT CCCTGATGGT CGTCATCTAC 
841 CTGCCTGGAC AGCATGGCCT GCAACGCGGG CATCCCGATG CCGCCGGAAG CGAGAAGAAT 
901 CATAATGGGG AAGGCCATCC AGCCTCGCGT CGCGAACGCC AGCAAGACGT AGCCCAGCGC 
961 GTCGGCCGCC ATGCCGGCGA TAATGGCCTG CTTCTCGCCG AAACGTTTGG TGGCGGGACC 
1021 AGTGACGAAG GCTTGAGCGA GGGCGTGCAA GATTCCGAAT ACCGCAAGCG ACAGGCCGAT 
1081 CATCGTCGCG CTCCAGCGAA AGCGGTCCTC GCCGAAAATG ACCCAGAGCG CTGCCGGCAC 
1141 CTGTCCTACG AGTTGCATGA TAAAGAAGAC AGTCATAAGT GCGGCGACGA TAGTCATGCC 
1201 CCGCGCCCAC CGGAAGGAGC TGACTGGGTT GAAGGCTCTC AAGGGCATCG GTCGACGCTC 
1261 TCCCTTATGC GACTCCTGCA TTAGGAAGCA GCCCAGTAGT AGGTTGAGGC CGTTGAGCAC 
1321 CGCCGCCGCA AGGAATGGTG CATGCAAGGA GATGGCGCCC AACAGTCCCC CGGCCACGGG 
1381 GCCTGCCACC ATACCCACGC CGAAACAAGC GCTCATGAGC CCGAAGTGGC GAGCCCGATC 
14 41 TTCCCCATCG GTGATGTCGG CGATATAGGC GCCAGCAACC GCACCTGTGG CGCCGGTGAT 
1501 GCCGGCCACG ATGCGTCCGG CGTAGAGGAT CCACAGGACG GGTGTGGTCG CCATGATCGC 
1561 GTAGTCGATA GT'GGCTCCAA GTAGCGAAGC GAGCAGGACT GGGCGGCGGC CAAAGCGGTC 
1621 GGACAGTGCT CCGAGAACGG GTGCGCATAG AAATTGCATC AACGCATATA GCGCTAGCAG 
1681 CACGCCATAG TGACTGGCGA TGCTGTCGGA ATGGACGATA TCCCGCAAGA GGCCCGGCAG 

17 41 TACCGGCATA ACCAAGCCTA TGCCTACAGC ATCCAGGGTG ACGGTGCCGA GGATGACGAT 
1801 GAGCGCATTG TTAGATTTCA TACACGGTGC CTGACTGCGT TAGCAATTTA ACTGTGATAA 

18 61 ACTACCGCAT T AAAGCT T AT CGATGATAAG CTGTCAAACA TGAGCCATGG CTGCGCGTAA 
1921 CCACCACACC CGCCGCGCTT AATGCGCCGC TACAGGGCGC GTCCCATTCG CCATTCAGGC 
1981 TGCGCAACTG TTGGGAAGGG CGATCGGTGC GGGCCTCTTC GCTATTACGC CAGCTGGCGA 
2041 AAGGGGGATG TGCTGCAAGG CGATTAAGTT GGGTAACGCC AGGGTTTTCC CAGTCACGAC 
2101 GTTGTAAAAC GACGGCCAGT GAGCGCGCGT AATACGACTC ACTATAGGGC GAATTGGAGC 
2161 TCCACCGCGG TGGCGGCCGC TCTAGAACTA GTGGATCCCC CGGGCTGCAG GAATTCGATA 
2221 TCAAGCTTAT CGATACCGTC GACCTCGAGG GGGGCCCGGT ACCCAGCTTT TGTTCCCTTT 
2281 AGTGAGGGTT AATTGCGCGC TTGGCGTAAT CATGGTCATA GCTGTTTCCT GTGTGAAATT 
2341 GTTATCCGCT CACAATTCCA CACAACATAC GAGCCGGGAG CATAAAGTGT AAAGCCTGGG 
2401 GTGCCTAATG AG T GAGCTAA CTCACATTAA TTGCGTTGCG CTCACTGCCC GCTTTCCAGT 
24 61 CGGGAAACCT GTCGTGCCAG CTGCATTAAT GAATCGGCCA ACGCGCGGGG AGAGGCGGTT 
2521 TGCGTATTGG GCGCTCTTCC ATGGTACTTA ATTCAACTTC CATTTCTCTG TATCTTTCAA 
2581 TACGCTCTTT TAAGTCCTTA ATTTCTTTTT TTAATTCCTC ATTTTCAGCA AATAACTCTT 
2 641 TTTCTTTGTT TGTC^ftgj^^H^g^qCp^gQglC^gjrATCA AGAACCTTTG CATAACTTGC 
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Fortsetzung Abb. 13 

2701 TCTATATCCA CACTGATAAT TGCCCTCAAA CCATAATCTA AAGGCGCTAG AGTTTGTTGA 
27 61 AACAATATCT TTTACATCAT TCGTATTTAA AATTCCAAAC TCCGCTCCCC TAAGGCGAAT 
2821 AAAAGCCATT AAATCTTTTG TATTTACCAA ATTATAGTCA TCCACTATAT CTAAAAGTAA 
2 881 ATTCTTCAAT TCTCTTTTTT GGCTTTCATC AAGTGTTATA TAGCGGTCAA TATCAAAATC 
2 941 ATTAATGTTC AAAATATCTT TTTTGTCGTA TATATGTTTA TTCTTAGCAA TAGCGTCCTT 
3001 TGATTCATGA GTCAAATATT CAT A T G AAC C TTTGATATAA TCAAGTATCT CAACATGAGC 
3061 AACTGAACTA TTCCCCAATT TTCGCTTAAT CTTGTTCCTA ACGCTTTCTA TTGTTACAGG 
3121 ATTTCGTGCA ATATATATAA CGTGATAGTG TGGTTTTTTA TAGTGCTTTC CATTTTGTAT 
3181 AATATTACTA TTATTCCATG TATCTTTATC TTTTTTTTCG TCCATATCGT GTAAAGGACT 
3241 GACAGCCATA GATACGCCCA AACTCTCTAA TTTTTCTTTC CAATCATTAG GAATTGAGTC 
3301 AG G AT AT AAT AAAAATCCAA AATTTCTAGC TTTAGTATTT TTAATAGCCA TGATATAATT 
3361 ACCTTATCAA AAACAAGTAG CGAAAACTCG TATCCTTCTA AAAACGCGAC GTTCGCTTAT 
3421 TTTTTTTGTT CTGATTCCTT TCTTGCATAT TCTTCTATAG CTAACGCCGC AACCGCAGAT 
34 81 TTTGAAAAAC CTTTTTGTTT CGCCATATCT GTTAATTTTT TATCTGGCTC TTTTGTCAGA 
3541 GAAATCATAA CTCTTTTTTT CGATTCTGAA ATCACCATTT AAAAAACTCC AATCAAATAA 
3601 TTTTATAAAG TTAGTGTATC ACTTTGTAAT CATAAAAACA ACAATAAAGC TACTTAAATA 
3661 TAGATTTATA AAAAACGTTG GCGAAAACGT TGGCGATTCG TTGGCGATTG' AAAAACCCCT 
3721 TAAACCCTTG AGCCAGTTGG GATAGAGCGT TTTTGGCACA AAAATTGGCA CTCGGCACTT 
3781 AATGGGGGGT CGTAGTACGG AAGCAAAATT CGCTTCCTTT CCCCCCATTT TTTTCCAAAT 
3841 TCCAAATTTT TTTCAAAAAT TTTCCAGCGC TACCGCTCGG 
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90 100 



HPN165 

ATGAAACAATTTAAAAAGAAACGAAAAAAG 

TTATCCCTTTACTGATTGGCGGGTTTGCTAGTGGGGTCTATGCGGATGGAAC^ 

AAGCCAAAAGGTATGCGTGCATCGTCCATGGTATGCTATATGGAGTTGCGATAA 

GGAAACCAACTCATCACAAAAACTTGGGCAGGGGGTAATGCGGCTAACT^ 

C CAATTT AAAAAATG AT AACGG CACTT ATTTTTT AAGCG G T CTGT AT AACT ACA C CG G AGGGG AAT AT AATGGGGGG AATTT 
AGACATTGAATTAGGCAGTAACGCTACTTTTAATCTAGGTGCGAGTAGTGGGAATAG CTTCACTTCTTGGTATCCTAATGGG 
CATACTGATGTTACTTTTAGCG CTGGGACTATCAATGTGAATAACAGCGT AG AAGTGGG CAATCGTGTGGGATCGGG AGCTG 
GCACGCACACCGGCACAGCCACTTTAAACTTGAACGCTAATAAGGTTACTATCA 

GCAAGTGAATGTAGGCAATGCTAACAGCGTTATTACCATTAATTCGGTTTCTTT AAATGGGG ATACTTG CAGTTCTTTAG CT 

AGGGTGGG CGT AGGGG CTAATTGCTCCACTTCTX3GG 

TTAGCAATTCAAGCGGCAGTTTCACTTTTGAAGAGAACGCC^ 

CAATAAAAAGTTTAACGCTACCAATAATACCGCTTTTAATAGCGGTAGTTTTACT^ 

GCGAATTTTAGTAACGCTTCCTATACTTTTAATAATCIAAGCGACTT^ 

TTAATGACC^GACCAATCAAAGCACCCAGGACCCCCAAATTGAAAACAGCT 

TTTTG CG A CTTTTG AGCAAG CCTTT AA CAATTCAAAC CAC CAACTAACG AT ACAAAAC G CTT C CTTTAAT AA CG CT ACTTTC 
AACAATACCGGTAAAATCACTATAGAAAAAGATGCGAGCTTTAATAA 

TG ACT ATT AGTGGTGGCG TT A CTTT AAG CGG T AAAAATGACTTG AAAAATGGTG GAA CCCTTGATTTTG GG AG TTCT AAAAT 

CACTCTCACTCAAGGGACGACTTTCAACCTCACAAGTTT 

ATCACTTAGAATCATCTTTTAAACCATGCGAT^ 

AAAGTTTCGCTCAAGGTTTGTGGGATATGATCACTTA 

TAAACCGACTGACTCTTCGCCCTCTAAATCCTCTACAAACT 

ATCTACAAACTGCAAGAAACTTTCAGCGACAATTCCAT^ 

T CATT AACGG CTCCAAATTTG ACTT AT CCG CTT C AAATT ATATCAATG CTGACATGC CTTG^TAT AACGAT AAAT ATT AT AT 
T CCT AAAT C C CAAAATTTT ACAG AG AG CGGG ACTT ATT ACTTGC CG AG CGTTCAAAT ATGGGGG AG CTACACT AACT CG TTT 
AAACAAACCTTTAGCGCAAGTAATAGCAATCTGGTGATTG 
ACACGGTGGCTTTTGGGGACACTTC^GGGAGCGCn'CrTAATGG 

G ACT AACGG CACTT AT AG CG CTT ATC ATG T CT ATAT CAC AG CG AAT CTG CG TT CTGG CAATCGT ATAGG CAC CGG TGGG G CA 

G CCAATCT AAT CTTT AATGGGG T AGAT AGT ATCAAT ATCGCT AA CG CT AC CATCACGCAACAT AA CG C CGGGG CTT ATT CAA 

GCTCTATGACTTTTTCCACGCAAAACATGGACAATTCX5CAGAATTTG 

TGGCACAACTTTCACTAACCAAGCCAAAGACGGGAAATTCATT^ 

AATGGAGGGAGTTACCAATTCAGCGGCGATAGCTTGAATTTTTCAA 

GCGCAAAAAATACTATTTTTAATAACGCTAATTTT 

GTTTGTGGG^GATTTCACTAACGCTAATTCAAATTTGCAAATCG 

CAAAATACCGCTAATTTTAATAATACCGGCTCTGTTAATATTGCAGG^ 

CT ACG AACACGAG CGTG AAAGGG AAAG TT ACT CT GAAT AACATCACTTTAAAAAACTTG AACG CT CCTTTGTCTTTTGGCG A 

TGGGACGATTGTTTTTAGCGCTCATTCGGTCATTAATATTGGTC 

TCTTCTAAAGCAATTGAATACAACGACGCTTTCAGTAAAAATCTA 

GTGAAAAGCTCGTTTCTAGTGCGGGTAATGGCGTCTATGATGTGGTGTATTCT^ 

GCT ITITT CACCCAACAGCATTTCTATCCGGCGTT^ 

CGTTTGTATTATCAAAACGCTCTCGGTTTTATGACCTACATGCCTAATAGCT 

CCATTTACTATTACGACAACAGCATTGACTTTTATGCGA 

CACTGGGCAAAACAGCGCGATCGTTTTTGGGGCTAAAAATATATGGAC 

ATT CG CTTTGGGGACAATAAGGGAG CAGGGAG TAATGATGCGAGTGGG CATTGCTGGAATTTG CAATG CAT AGGCTTTATCA 

CAGGGCATTATGAAGCGCAAAAGATTTACATCACCGGCAGTATTGAAAG 

CCTTAATTTTAACGGGCTTCAAGGCATTCTTTTAATO 

ATGAATTTTGTTTCTAACAGCGCGAACATTCAGGCTCAA 

CTAATTTTAGTTTCAACGCTTTGAATCTGGATTTTTCT 

T AAATTCAATG C CGTT AATGCGATCAGTTTCACTAACAG CTCTAATTT AAG CT CTGGTTTGT ATCAAATG CAAGCTAAAAG C 

GTGTTGTTTGACAATTCCAATTTAAGCGTTTCAGT^ 

CCTCTATCAATGCGAGCAACCATTCAACCTTAGAACTTCA^ 

CCAAAGCGCCATTAATGTTTCTAACAACGCC^CCATCAACGATTATGCG 

TTTAACGG<MCGGTTAATTTCAATTCAGCGAATATTACTACGAG 

CTTTACGAGGGCAGTTTAATTTAAGCAATAATTC^ 

T AATTT CTATG AT AACGCTTTTTCTCAAAGC 

GGCAA C CT CTTAAACCCT AACAACAGTAG CGTG CTGAATTT AAAAAACAGCCAGCTTGTTTTTAGCGATCAAGGG AG CTTGA 

ATATCGCTAACATTGATTTACTAAGCGATCTGAATGGTAATAAAAATCGTGTGTA 

TAATTGGTATGAGCGTATCAACTTCrTTGGCATCCGCAT^ 

ACTAAC CCTCTC^VAT AACG CCCT AAAAATCACCG AGAGCTTTAAAAAT AAC CAACTG AG CX3TT ACGCTCTCTCAAATC CCGG 

GCATTAAAAACACGCTCrATAACATTGGCTCTGAAATCTTTAA 

TTATAGCGATGACGCACAAGGCGTGTTTTATCTCACGAGCAG 

AG CGG GAG CAAT AACACCACG AAAAAT AACAAT CT AACCT CTTC AATCTTCTGTCATTT CG CAAACCT AT AACG CG CAAGGCA 
ACCCTATCAGCGCGTTACACGTCTATAACAAGGGCTATAATTTCAGTAATATC^ 

CT AC CCTG AAAT CAAAAAG AT ATT AGGG AATGATTTTTCGCTTTCAAGTTTG^ CAATTT AAAAGG CG ATG CGCT AAAC CAG 

CTTACGAAGCTCATCACGCCTAGCGATTGGAAAAACATTAACGAGTTG 

TCAATAACGGCACTTTGATTATAGGAGCGACTAAAATAGGGCAAACAGAC^CCAATAG 

CTATCAAAAGCCTTGCGATTACACTGATATTGTGTGCCAAAAATT^ 

TCG^CTGATTTGGGCTATATTGACACGACTTTTAACGCT 

G*GGGGACTGGGGGGAGTG<TGAGCGTAACTTTTAACAGCCAAACT^ 

AACCGATGGGATTTTTAGCATGCTGGGTCAAGAGGGCATCAATA^ 

GAAGTGGCAATGCAATCCATTAACAAAGCCG^XX^ATTAGGGAATTTGATA 



ERSATZBLATT (REGEL 26) 



WO 00/73502 



PC17EP00/05024 



16 / 82 

Abbildung 14 

GGCXX5TATTTAACGCCTGAGCAAAAAAATCAAA 

T AG CGGTTTG AACACGG C G ATT AAGG ATTTG ATCAGACAAAAATT AGGCTTTTGG AC C GGG CT AG TGGGGGG ATTAG C CGG A 
CTGGGGGG CATTG ATTTG CAAAAC C CTG AAAAG CTT AT AGG CAG CATGT C CATCAATG ATTT ATTG AGT AAAAAGGGGTTGT 
TCAATCAGATCACCGGCTTTATTTCCGCTAACGATATAGGGCAAGTCATAAGCGTGATGCTGCAAGATAT^ 
CGACGCTTTAAAAAACGATGTAGCCGCTTTGGGCAAGCAAATGATTGGCGAATT^ 
GAAAGCTTGCTGCAAAACCAGCAGATTAAAAGCGTTTTAGACAAAGTCT^ 

AAGGTTTGGGGG ATTTG AT C C CT AAT CTTGG T AAAAAGGGG ATTTT CG CTCC CT AT GG CTTG AGTC AAGTGTGGCAAAAAGG 
GG ATTTT AG TTT CAACG CG CAAGG CAATGTTTTTG TG C AAAATT C CACTTT CT CT AACG CT AATG G AGGCACGCT CAGTTTT 
AACGCAGGAAATTCGCTCATTTTTGCCGGAAACAACCACATCGCTTTC^ 

ATCAAGTTT CT AACATT AACG TCA C CATG CTT AACG CT AG C AACG GCCTTAAG ATT AACG CCACT AAT AACAATG TTT C C GT 
GTCTCTUVGGCAATCTGTTTATCAACGCTAGCTGCGTGCAAC^ 

ACCGCTCAAAATAACGCTTCTTCTAGTAATGCGTCAAACAACGCGCCAATCGCCTTAAATAATAACGATGAAA 

TT ACGGCGAATGGTTTCAATTTTTCAGG CAATATTT ACG CTAACGG<3GT<^T^GATTTTTCAAAAATT AAAGGCT CTGCAAA 

CGTT AAAAACCTGTATCTTTACAATAA CG CTCAATTCCAAG C CAACAACCT CACG ATTTC CAACCAAGCGGT ATTAGAGAAA 

AACG CT AG CTTTG T AACG AAT AA CTT AAACATT CAAGG AG CGTTT AACAACAACG C CA CG CAAAAAAT AG AGGTGCTTCAAA 

ATTTAGTGATCGCTTCAAACGCTTCTTTAAGCACCGGGATT^ 

GATCGATTTTAATTTAGAAAATTCTGAAACGCCTGTAAATCCGCT 

CAAACGCCTTTTATGAATGTCAGCGTGGCTAATGGCGGAACTTACACTTTA 

T CAAC CCT AAC AG CTTG CAAT CGT ATTTG AAGCTCTATACCTTAATCAAT AT C AA CGG AAAC CACAT AG AGGAAAAAAACGG 
CGTATTG A CTTATTTGGG C CAA CGGGTTTTATTACAAG AT AAGGGG TTATTATTGAGTG T AG C ACT ACCT AACT CAAACAAC 
G C CT CT CAAAACAACATTTTAAGCCTTT CTGTC CTTCACAACCA 
CCCCTCCCACCTTACAGGATTACATTGTGGGCATTCAAGG 

CGCTATCAAGTCGCTTTCAACATTGATG ATGGAGACTAAAGAAAACCCG CTTTTTG CGCCGATTTATTTAG AAAACCACTCT 
TT AAATGAAAT CTT AGGCGT AACAAAAG AT C!TTCAAAACAC CGCAAG CTTG ATTTCT AACCCT AATTTT AG AAAT AA CG CT A 
CCAGCCTTTTAGAAATGGCGAGTTA(ZACCCAACAAACC^GCCGTTTGACAAAACTCT 

GTCCAATTTTTCAGAGCGCTTGTTAG AG CTTAAAAACAAGCGTTTTAG CGATCCTAACCCTAGTGAGGTTTTTGTCAAATAC 

TCTCAACTCAG CAAACACCCCAATAACCTTTX^ATTCAAGGGGTGGGAGGAGCGAG CTTTATTTCTGGGGG CAATGGCACGC 

TTTATGGCTTGAATGTGGGCTATGACCGATTGGCTAAAAGCGTGATC 

TAACGGGAACATCATGCATTCTTTGGCTAATAATGTGGATGTGGGGATGTATGCG 

ACTITCAGCGCGAATCAAACTTATGGAGGCAATGCGAGTCATATCA^ 

GCTACAACTACAACACCTGGACAACGAGCGTGAATGGGAATTACGGCT 

AAAACCTCAAGTGGG CTTGAG CTATCATTTCATAGGCTTG AGCGGGATGAAAGGTAAAATG CAAAATCCAG CTTACCAACAA 
TTCGTCATGCATTCAAACCCTTCTAACX1AATCGGTTTTAACGCT 

ATTC CT ATTATTTTGT AACGGCG AGGTTGGG T AGGG ATCTTTTG ATCAAAG CT AAAGGCG ACAATGTGG TG CGTTTTGTGGG 

TGAAAACACTTTATTGTACCGCAAGCX3GGAAATTTTTAACACTTTTGCGAGCGTG 

CGTTTGATGTATGTGAATGCGGGGGTGGGGCTTAAAATGGGCTTGCAATACCAAGAT 

TGCGAGTGGCGTTTTAG 

HPC001 

ATGAAATTTTTACGCTCTCTTTATGCATTTTGCTCCAGTTGGGTGGGG 
TTACGGCATCCCCATTCCTAAAATCCCATGG^ 

GGGGATCGCCCTAAACGCGGCGAAGTGGTGGTGTTTATCCCTCCCCATGAAAAAAAATCTTA 

CTATTGGGGGCGATGAGGTGTTATTCACTAGTGAGGGGTTTTATTTGCAC 

CGCTAAACATTACCCAGATGCTATGACTAAAGAATTTATGGGTAAAATT^ 

GG TATCCATTAC CAAAAAGACAATG AAACCTT CCATTT AATGGAG CAGTT AG CCACTCAAGGCG CGGAAGCTAAT ATCAG CA 

TGCAACTCATTCAAATGGAGGGCGAAAAGGTGTTTTATAAAAAAATCAAT^^ 

GG AT AATTCTAGCGACTCGCGCTTTTGGGGGAGTGTGGCT^ 

TTG AGTTTAAAAAAT AG C CTGG AAATGG ATG CAGAAAATAACCCCAAAAAACG CT ATTTGGTGCGTTGGGAG CGCATGTTT A 
AAAG CGTTG AAGG CTT AGAAAAAATCATT AAAAAAG AAAAAGCAACGCATTAA 

HPC042 

ATGAAAGAATTTAAGATTCTAATCATCCTTATTGTGGTGGTAGGCGTGATTTATTATGGGGTTGAGC 
TGATGCACCCTAAAGTCGCTCCGGCAGATTTTGCTTTCAAG^ 

GGGCAAACAGCTTGTAGCCGAAAATTGCACCGCTTGCCATGGCATTAAATCCC^^ 
AGCX3CGAGCAACTCTTTTGGGGTCX3TGCCACCGGATTTAAGCCATGT 

TCATCAAAGACCCCGTGAAAACGGCGAAATTGAGCCATAAGTTCAACGATGAAAGGCCCT 

ATTTAGCGATCAAGATTTGAGCGATATTGTGGCGTATCTCACTTCTATTTTGCCT 

GCACAAAGCTGTCAAAGGTGCCATAGCTTGGATTATGCTAAAGATAAGGCCT 

T AGGCTCTCATG CAC CTG ATTTG TC C^TGATGATTAGAGCTAAAGGCGAACATGGCTTGAAT ATTTT CATCAACGAT CCG CA 
AAAGCTT 

HPC065 

ATGAATAAACCATTTTTAATCT^ACTCATAGCCCTAATTG 
AACACC^AGTTAAAGGCGAAGCCTATTTCCCTAATGATTTGCA^ 

G AAAAATGGAG CGGTTATAGGCGAT AAAGGTTT AACG CAG CT AAG AATCGGT AAGAATTTCAATT ATGAAAG CAGTTTTTT A 
AATGAGAGTGAGGGGTTTTTCATCCTTGCX3CAAGATTC 

AAAGTGAGGAAACGGAGCTGAAATTAAAGGGCGTTGAAGCCGAAGTCCAAGATAAAGTC^ 

CAATAACCCTAACGCCAGCCAACAATCTATCGTTATCCCTTTGGAGACTTTTC 

TTAGCGGTGGTGTTAGCGGACAATTGAGCGAATTTATA 

CAAGCACCACGATCAATTCTTTAATGGCGATCCCTATTTTTATG 

GTTGGTCGTGGATTATGTGCATGGAAACCCTACGCCTATTAGAAACATTGTO 

ACTTACCTTATCGTAGATGGCAATAACATGATCGCTTCTACAGGGAAAAGAATACTCTCAGTCG 

ACTATGATGGGGATATTATAGATTTGCTTTATGATAAGGGGACTTTATACGTGCTCACGCT 
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GG AT AAGAGTTTGAGGG AATTAAACAG CGTG AAACTG C CCTTTGCTTCG CTCAAT ACCATTG T ATT AAA CCAT AAT AAATTG 

TATTCrTTAGAAAAGCGTGGGTATGTGATAGAAGTGGATTTGAATGATTTTGA 

TAGGCMTTTTARGTTTTTTTCATCCAATCGTTTGGA^ 

CTATTTAGATTATAACGATTTTAAACCAAAACTTTATCCCGTTGTGGAAAAATCGGCATCTA 

AAAGGG AACA CTCC CATTT ATTTG C AAG AAAGG CAT AAAG CT AAAG AAAAG C CTTTAG AAG AAAACAAAGTTAAG C CAAG AA 

AT AG CGGGTTTG AAG AAG AAG AAG TT AAAA C CGG AAG CC GTG AT ATGG AG CCTACT AACAAT C AAAAT AACG CT ATC CAAAA 

AGGCATAAAAGAAAGTCAAGAAAACAAAAACGCTCCTGCTTCAAAAGAGGGTAACCAAAAAGGTG 

TCAAAAGAGGATAACGCTATTAAAGAAGCGCCAAAACTCAGCCCTAAAGAAGAAAAACGCCGCT 

AAGCGAAAGCCGAACAAAGAGCGAGAGAATTTGAACAAAGAGCGAG 

AAGAAGAAAAGCTTTAGAAATGAATAAGAAGTAG 

HPC066 

GATCACCCTATTGCTATGGGTTTTTGGCTTT/TTAGCACGACT^ 

GCATTTATTTATGCCCTTACGCTAGGGTGCAATCGGTGTTGTATGACAATGACAC 

CGGCGGAGTGCTTTATAACAATCAGGGCCATCTCTTCCCCTTACCCCCCAAAAAACGCAG 

TGCTTGCATTGCGTGCAGGTTTGCCCCACACATATTGATATTAGGAAAGGCTT^ 

GCGTGNATGCATGCACCATTACCATGGCTAAATACAACCGCCCTTCACTCA 

GCGCCAAAAAGTGCGCCTGGTGCGTTTAAAAACGATCGCTT'ACATGGGGG 

ACTTCG TTT AAAAAAG AACG CATG CTCTT AG ACATT AACCG CAACAG CG AT CTGT ATG AATTG CG CTCTAGTGGGTATGTGG 

ATAACGATTATGTGTTTTTATTCGA.CAACACGGACA 

CCAAAT CAAAAAGCCTTT AAATCCT AT CG CCATT AAAG C CG 

HPC074 

GAT CAAAATAACGATTTGG CGTTTGTGGTGTG CTTGCAAATCCCTTTGAGGGTAGCGATTGAAATCAGCTCGCCTTCAAAGT 
ATTTCAGAACCTTTAGCGAAGGGAGCATGGTCATGTATTTTTCGCC^ 

GGT CATGTATTTTATG ATTT CTATCATGCTCACTTT AG TG T CGTTG CTTTT ATTTGTG AAATG CATTTCT AG CTTTTGG A CA 

GCGATTGTCAATTTTAGCAGTTTTGATATTAAAGAAGTGTTCCACCCCATTC 

ATCTGGTCAAGGCGATTTTTGAAGAGGAAGTTTTGGGTAAAAAT 

CAGATTTTTAGGCTCTATCATTATCGCATTAGCCATTGAAG 

NAAATCACTTATGCGGTGTATTTGGCT 

HPC083 

ATGCG CT CTCCAAATTT AGAAAAAGAAGAAACTG AAAT CAT AG AAACACTCCTT ATG CGTGAAAAAATG CGTTTATG C CCCT 

TGTATTGGCGCATCTTAGCGTTTTTAACCGATCGTTTGTTGG 

CTTGCATTCTTTATATTGGCTGACTAACCCCATTT^ 

TATGAAATCTTTTTTGTGTGTTTGTGCAAGATGAGTTT<^CTAAACTG^ 

CAGATTGCCCCA.GTAGGGCTATTTTATTGAAGCXSTTTAG 

AGTGTTTAAAAACCCCTATCATAGG^CATGGCATGAAGAAAAA^ 

HPC084 

ATGATTTATTGGTTGTATTTGGCGGTCTTTTTTTTC 

AACAAAACC^TAAGATTTTTGAAATCCTTGCGGATAAAGTGAGCGCT 

CTTATTGAATTATGATGTGTATATTTTAGCGGACAAGGTGCGTTATGACACTA 

ATCAAGGTTOATAGGGGCGAGGGTTTGCTCGTTAAAACCGATTATGTGAAATTGAGCTT 

TCCCCTTTTATGTCCAAGACAGCGTGAGCGGGATTTGGGTGAGCGCGGAT^ 

TAAAAACATGAGCGCTTCAGGGTCCAGCATTGATAACCCCATCT 

AAATCGCATTTGTCTATGTGGAATCCTAAGATCTATGTCGGTGATATTCCTGT^ 

CTAGCAATAAAAGAACTACCGGGTTTTTATACCCTGAGTTTGGTACITC 

TTATTTAGCCCCCAAAAACTCATGGGATATGACCTTTACCCCACA^ 

GCGCGCTACATTAACTCTAAAGACGACAGGTTTTTATTCAA 

ACGATTTG AGG AATCAAAAT ATCT ATGGTTTTG AATTTTTAAGCTCTAG C2AGGGACACTTT AC^UUUVATACI^T CATCTTTAA 

GTCTAATATTGATAACGGGCATTACATTGACTTTTTATACATC 

CGCATCACAGACGCCAaSCACATGTCTAGGGCGAATTACTATTTGCAAAC^GA 

ATTTTTTAAACCTC AATAAAATCAACAACAACCG CACTTTCCAATCTG TC C CTAATTTGCTU^TACCATAAAT ATTTAAATT C 

TTTGTATTTT AGAAATTT ATTGTATTCXXSTGGATT ATCAGTT^ CTATGG CTATGTGCAA 

AACCCTTTXSAATGTGCCGGTGGGCTTGCAATTTTC^ 

TATOTAAT13TGGCITTAATGCAATCTAACAATTCC1T 

GTCTTCAAATTTTTCCA-TGTATGTCAATATGGAT^ 

ATTTTCAACATCCCTTATTACMCCTTTAAAAACGGCT^ 

GCTACACTTCGCCTTTATTGAGAGATTATGATTATCAAGG 

TAGCGATGCGAGCAAT AAAACCXTTC AATTT AAC CCT AACG CAAT ACCTTTAT^ CTTAGGAGGG CAAGAGTTGTTGTATTTT 
AAAAT ATCG CAACTCATCAATCTTG ACX3 AT AAAGTTTCG CCCTTTAAAATGCC CCT CAAGAT CGGGTTTTCG CCCT 

TAAOTGGATTGAATATCTTTGGGAATGTCTTTTATTC^ 

CCAACGCAAGTTTTT AAGCTTT AAC CT CTCTT ATTTTTTAAGGAACIAATTTTAGCAGTGGG ATT AATAG CATTGTAG AAAAT 
CTGCGGATTATTTAA 

HPC104 

ATGGATATTTATGCGTTATACATAGCGATAGGGCTTTTTACTGGCATTCT 

TCATTGTCCCTATCATCCTCGCAACCGGGCATTCTTTTX3AAGA 

GTTCGTGGGATCTCTTTTGAATTTCAAAAAAAAATCG 

GGGGCAAGTTTTAGCC^3ATTTGTTTTAAAAATCGTT^ CGTGTATT 
CTATGATCCAATTTGTCTTAAAACCCAAAAAAAAAGATTTTATAG 

ATTTTTAATTGGCGCG CTCACAGGGTTTTTTGC CAT CACTTT AC-GG ATTGGTGGGGGGATGCTCATGGTG CCTTTG ATGCAT 
TATl"l"rri'AGGGTATGATTCrAAAAAATGCGTGGCGCTAGGGTTATTTTTCA 
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CTTTAATGTATCACCACATCATCAATAAAGAAGTT 

CATTGGG ATT AAATGG AT CATGGGG CTTTTG AATG AAAAAATG CAT AAAATTTTG ATTTTAGGGGTG TATGGTTTGTCGTT A 
TTG ATT ATTTT AT ACAAACT CTTTTTTT AA 

HPC115 

ATGAAATGTTCGCATTGCCAGTTGGAGTTTAAAGAAAGTGAGCTTTTTAAAGAAGTGATCCATCATAAGGAATTGTATTTTT 
G CTG CACGGGGTGTG CTAG AGTGTATGCGTT ATTATTGG ATTTGAATTTAGAGAG CTTTT ATG ACAAATT AAACGATTCCAC 
TTTAGCCCCCGTAACGCCCCAAGATTCAATGAGCGCTTTGGAATTAGAACAAGCCCT 

AT CCTT AATCTTTTG CT AG AAAAAACG CATTG T AACG CTTG CTTGTGG CTCAAT CAAAAGG TTTT AG AG CG CTT AAAGGGGG 
TTAAAAAAGTGAGCGTGAATTTCACCACCGACC^ 

AAAAATTG AG AGTTTGGGTT ATGGGG CT AAAATTT AT AACG CAAAAAATT ACG C C CT AAAAG C C CAAAAAG AG CAG CGCT CC 
TATTTGCTCACTTTAAGCGTGGGCTTTTTTGCCACCATGAATTTGATGTTTAT^ 

GTGCX5AGTTATGGCACTGGCATGGATAAGCTTATGCAAAGGAATTTGGATCTCGTATCGCTCTTTTTAAGC 

AGTGGTTGTGGGGCGTTTTTTCATTAAGGGGGCGTTT^^ 

TTTGGAGCGTTATCGGGATTTGTTTATTCCCTTTATGCGATC 

TTTT AACG CTTG TTTTTGG CTCTAAGTTTTTGGAATT AAAAG CTG TTTG CG AATG AAAAATGT CTGGCCCT AG AAT C 

GCATG AAATCCAT AG CGTGATCGTTGTAGAAAAGGAC AAG CAGATAGAAAAACACCCTAAAGATGTGG CGATAGGCTCTGTT 
G TTTGGG TG CCAAG CGGGG CT AAAATCG CACT AG ATGG AGTG CTTTT AAAT AACG CG AG CG TGG ATG CGTCTTTG ATCAG CG 
GGG AGTTT AAG CCTTTGG AATTGGGGGTT AATGAT CT AATTTT AGGGGGTTATGTG AATG TGGG CGT G CCTTTT AG CT AT CA 
AGTGAGCGCGACTTTTCAAAACTCACGCCTTTCTAGTTTGTTA 

G AG AGT AGCG CG AAT AAAATTG CGGAT ATTTTTT CT AAAG CGGTGTTGTTTTT AG CCTTTGT AAG CTTTTT ATT ATGG CAAT 
TTGGTTTGGGGGGTAATTTTGAAAAAGCCTTAATGGTGTGTA^ 

AGCTACGCCCATTGCGTT AGTG AT AGGGGTGTTTAAAAACCCTTTGATCGTGTTT AAAG AAG CGT^ 
GCTAAAGTGGAAAAAATCTTTATAGACAAAACCG 

HPC120 

ATGCTACTAACAACACTCAAGCTAAAATCTATTAAGGAAATGAGT 

GTATCAATACCAGCGTTGAAGCTTTAGAAAATGACGGCTCTAAACCAAACGATTTGACCT 
AGCTGAAAGAAATGAGACTCAAAGAAATGAAGCTGAAAG 

AAAGAAATGAAAGTCAAATCCATTTCGTATATCGGGCTTTCTTACATGTCTGACATGCT^ 
GTGTGGGCGATATTGTGGATTCTAAAAAAATAGACACCGCTGTTTT^ 

TGC CACTTTTG AAGG CGGCAT ATT AG AGTTT CATTTTGATG AAAAAGC CAGAATTG CCGGGG TAG AAAT CAAGGGTTATGGG 
ACTGAAAAGGAAAAAGGCGACTTAAAATC C CAAATGGGGATCAAAAAGGG CG ACAC CTTTGATG AG CAAAAATT AGAG CATG 
CTAAAACGGCTTTAAAAAGAGCTTTAGAGGGGGAGGGC^ 

GGGCG CGTT ATT AATTGTGTTTGATGTGAAT AGGG<K5GATAGT ATTT AT AT CAAACAATC GA CG AAA 

TTAAAACG CCGCATG ATTGAATCTTTGAGTG CGAACAAGCAAAGAG ATTTCATGGG CTGG ATGTGGGG CTTGAATGACGGGA 

AATTGCGTTTAGATC1AATTAGAATACGATTCTTTGCGTATCCAAGATGTGTATATG 

TTCTTCGCCTTTTTTGAAAACGGATTTTTCTACCGATGACGCT 

ATTTCAGACATTTTAATAGAGATTGACAACCCG 

HPC130 

ATGAAAAGA lU w lX;i - l - in GTTTTTATCACTCATGGGTGTTTGCGT^ 

GGG ATTTT AAATCT AAAGACTTGCCC CAAAAACT CCATCTTC CTTTC C CAAACAAT ACAG C CATGCGCG CAACT 

TAACGCATCAAAACACTACACTGCTACCG 

HPC133 

ATGCAAAGTCTTAGTTGGCTGAATTTAGCGTTCCG 

AATGGTATCATTACAGCGTGTTCAGGATTTTAACTAAGCATCATAAAATC 

AGGGGTGTTTATCCTATCGTATGCTTTCAAAATGCCGTTTGTT^ 

ATTATCTGGGCCAAACGCAACGACAAACCTTTAGTTTTCACGCCAAGGGTGAAGCGC 



ATTCGTTTTAAGCGCTTCTTTAATCTTTGAAAAAGCCTTATCCAAGCAGTATT 
TTAAAGAATTTAAAAGTCATCGCCATTACCGGAAGCTT 

HPC143 

ATGAAAAAA Cri ' C ' riT ATACCATACTCGCA CT TCTTTTAATCGC^CTTTTAAC^ 

GG AACAAAATCATCGCTTCGTATATAGAGAAAAAAATCAACCCGAACGAGCGCTACTTG 

ATTCAACTCTTTGGATTTTAAAGCTCAAGCCAACX1ATC 

AGCGTGGATTTGAATTACCACATAGATATTAAAGATTTACGCTCT^ 

TTATTACITCTGGGAATATCAAAGGGCATAGAAAAGCCC^ 

CTACAACGC CCTTTT AGATG ATTT C^UVG CTTTCTGACnT AAGCTTGAACG CAAAAG ACG CCAATTTAGAAG ATTTGCTTTAT 
TTAATCAATCGCCCCGCTTATGCGAACGGAAAAGTGTCC 
TGATTCTAACAGCCAATAACX5CTTTAATCAATAACGCCCTAATCAATCAAA 
CTTCAACCTCTCG CACTCAAG CGACTTT AAAGAGAAGAAAG CCATCAGCGAT ACCACCCTGACT 

ACAGC CCTAAAAAGCGAATAC CTTTTCTCT ATTTT AAAACT GAATG CCCCCT ACACTTT AG AAATAC CCAATCTGGCCAAAC 

TCCAAAACATGACTAACCACCCCCTAAAAGGGAGTTTGACITTAAAAGGCGCTA 

CAGCGGCCATTCAAATTTACTGGATGGCACGCTCGATTTCAC^ 

TCCACTTTAAAAGCCTTAGATTTATTCAATTACCCCAAGTTTT^ 

GCGCTAAGCAAGGCACATTGAAAGCCCGCCTAAAAAACGCAAGATTCCTCA 

TTCTCAATTTGATATTACTAAAGAAATCTATAACGATC 

CTCAGCTTAAAAAGCCCCAAAACCCAATTGAAAATCCATAACGGG CTTGTGG CAAACAAATGGACATGCTCA 
TAGATGO«3AAATCTTAAAATTCGTTTTTAAAATGAAA 

CGAAAAAGCCATCCAACAAAACCTGCAACAAGGCTTGAAAGAAATCCTAAAAAACGA 
TTGCTTAAAGATGATAAGCTCAAAGAAAAGCrTTGAAAAAGGGCTTAAGG 



ERSATZBLATT (REGEL 26) 



WO 00/73502 PCT/EP00/05024 



Abbildung 14 

HPC144 

ATGAAGAGATCTTCTGTATTTAGTTTCTTGGTAGCTTTTT^ 
TGGCCG 

HPC1S2 

TTGAAACATTTGACCCCACTCACTCACACCCTTTTr AAAG CCTTATGG CT AGGCACGGTCTTAAGCGCATCTTT AAGCTT AG 
TTG CAG CAG AAAG CC CCACT AG AACA.G AG CCT AAAC C CGCT AAGGGGGTT AAAAAT AAAC C CAAATCG CC CG TT ACT AAAGT 
CATGATGACCAATTGCGACAACCTTAAAG ACTTT AACG CTAATCAAAAAGAAGTTCTAAAAGCCGCCTATCAATTCGGCT CT 
AAAGAAAATTTAGGCTATGAAATGGCAGGCATTGCATG 

CGAGTGCGGG CGTGTATCATTCTTATATCCCAAGCGTT CT AAAAAG CTATGGGCATAATGATAGCCCCTTTTTGCGTAATGT 
G ATGGGGGAATTG CT CATT AAAG ACGATG CG TTTG CTTCTGAAGTGG CTTT AAAAG AG TTG CT CTATTGG AAAACA CG CT AC 
CATGACAATCTAAAAGACATGATTAAATCTTACAACAAGGGCAGTCGTTGGGAAAAAAACGAGAA 

AAAAAT ATTATGAAG AG AT ACAAGACAGGAT CAGGCGTTTG AAAG AATCTAAAATCTTTG ATT CGCAG T CT AGT AATG ACCA 
AGAATTGCAAAAAAGCGCTAATAGCAACCrGGATTTAGACCCTATCGGCAGCACCATGCCCCA 

TCTCAAAT AG AAAAATCT CAAATAGAG G AAAC C CAAG CAG AAAAACCC CAAG AAATG AAAG AG ACAACT AG CG AG CAAAT AA 
CCAACAAGCCAGAAAAAGCAAAAGATAAACCCATGTATTTGGCTCAAATCAATAGC^ 

CTCTCAAAAACCGG CTAGAGTGAGCCAAAAACG CTCCTCTAAAAATAATATCAGCGTT AAAAACAACACCAAAACCG CTTCC 

AAAAATTCCAAAAATAAAGAAATGTGCAAAAATTGCTCTCCAG^ 

TG CAAG AG CTTT AA 

HPC155 

GATCATTATCGTGCCGTTACCGCCTTTTGTGTTGGATTTTTHACT 
ATCGGGCTTTATATTGACAAGCCGACTGATTTTAGCGCTT^ 

TAAATGTCGCCACCACTAGAATGATTTTAACG CAAGGCTATAAAGGGCCTAGCACGGTGAG CGATATTATCACGGCGTTTGG 

GGAATTTAGCGTGAGCGGGAATTATGTGATTGGTGCGATTATCTTTAGTATTTT^ 

AATGGCTCTACTAGGGTTACTGAAGTGAGAGCGCGATTCGCTCTAGACG 

ATTTAAATTC^GGGCTTATTGATGATAAGGAAGCCAAAAAACGGCGCGC^ 

GATGGATG^CGCGTCTAAATTCGTCAAAGGCGATGCGATCGCTTCTATTATCATCACGC^ 

TTAGTGGGCGTGTTCCAAAGGGATATGAGTTTGAGCTTTAGCGCTAGCACCT 

TAGGGCAAATCCCTCCTTTAATCATTGCGACAGCGACCG 

HPC165 

ATGAAAAAGTTTAAAAAGAAACGAAAAAGTATCAAACGATTGCATCAAA^ 
TCGCACCTTTACTCATCAGCGGGTTTGTTAGTGGG^ 

AAGCCAAAAGGTATGCGTG CATCAT C CATGGTATGCTATATGGAGTTGCG AT AAATGGGAGGAAAAAACACAAC^ CACA 

GGAAACCAACT<^TCACAAAAACTTGGGCAGGGGGTAATGCGGCT 

CCAATTTAAAAAATGATAACGGCACTTATriTl"l'AAGCGGTCTGTATAACTACACC 

HPC183 

ATGTTAGTTACTCGCTTTAAAAAAGCTTTGATCTCTTATTCTT^ 

ACGCTTCAGCACAAGAGGTTAAAGTCAAGGATTATTTCGGGGAGCAAAC^ 

AGGGAGCTATGTAGAAGTGCCTGC»TGCTTAATGTTTGGAATAGGGTT^ 

ATTGITAAAGCGACTCTCAAAGGCGAAGATCTTAAACGC^ 

AGCTTTTAAAAAAGCTCAGCCCTGATCTTGTGGTAACCTTTGTGGG 

TATATCATTTCTTTCTTTCCAAGAGACAACGATCGCAGAGGC 

GACGCTTCTAAAAAATTCGCCAAAATGCAAGAAACTTTGGAT^ 

GGGTGGAGCTTTTCCATAAAGCCAATAAAATTAGCGGCC^TCA 

CAATTTTGGCTTGAAATACGTCAAATTTGGGCGCXSCTGA 

TTCATCTGGTGGCTAAGCCC^CTCACGCCreAAGATGTGT^ 

AGCAAGTT^ATAAACTC CC CACAATGGATATTGGCGGG C CTAG AG CCC CACTCATAAG CTTATTTATCG CTTT AAAAG C CCA 

CCCTGAAGCCTTTAAGGGCGTGGATATTAATGCGATTGTTAAAGACTACT 

GTTGAACCCTTTTTATGGCATTAA 

HPC186 

ATGG<3CGGATTCACAAGCATATGGCATTGGGTCATTGTTT^ 
AATTGGCTAAGGGTTTAOTCAGTGGGATTAAGAATTTCAAAAAAGCCGTGA 

AAAAACCCTAGACG CTCAAG CAACGCAAACC^AAGTGCIATGAG AGT AGCGAGATT AAAAG CAAACAAGAAAGTT AA 
HPC188 

ATGAAAAACTTTTCCCCACTTTGTTGTTTTAAAAAGCT 

ATGC CAATGG C^TTT AAAATCCAAGAGCAAAG CCT AAATGG CACGG CTTT AGGCTCGG CGT ATGTCGCTGGGG CT AGGGGTGC 
TG ATG CTTCCTTTTATAACCCGGCGAATATGGG CTTT ACT AACG ATTGGGGTGAAAACAGAAG CG AATTTGAAATG AC CAC C 
ACCGTGATTAACATTCCG 

HPC190 

TTGGAATTGAAAAAAATCGCCCTTATTTTAGATGGCATTC 

ATCATAATTTTTATATAGTGGTTGTCAAAAATGAG 

TGATGCGACTTCTAGTTTCAGGCTTTTGCAAGTGTTA 

GAACAGCGC^TCATTCATAAAATCATTCAAACCCATTTCAAACGCA 

AAACTTTAGAAAATAATGAAGAAAATAAAGATGAAAAGCTTATTT^ 

TTCTCGTTTGCCTAATATCCCTAGCACCCCTAGAGAATTTGGGTTAGGCAAAGG 

GGGAGTATTTTTGCTTACAGGCATATTGGCTCTATCAGGCAAAA^ 

TGTTGCTCTCCACTAAATCTTTAGTTATCCAGCCACGAGACATTCTTT^ 
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GTATCTTCAGGTCAAAAGCAATGTCGGGCAGTTCCCAG CCC CCTTTGGT AAGAGCATTTATTTATACATTGAT ATG CGCTTA 
CAAAGCCGAAAAGGAATGATGCGCGATGTGTATCAAGCCTTGTTT^ 

AGGTTTTACACCCCACTAGCCCTAAGTTTTACCATAAATTTTTATCGCTAGAAACCGAAAGCATTGAA 

tt atggg aaaagtttt at c caaaaa ct c gatg aag accaccag aaaaaaatggg ttt g attgtgg t agg cag ag ag cttttt 
ttatctaaaaaacaccgaaaagccctatataaaacagccaccccggttt^ 

CTCAAAGCGTGGTGGTGTTGAATGAAAGCTTGGATATCAATC 

GGATTTGGGCTTGTTGCTCTATGATTTTGACCCTAACAAGCGCTATAAAAACGAGATTGTCAAT^ 

AAC ACG CTCAACCG CAAG ATTG AG ATTTTT CAAACCG AT ATT AG AAAT C CT ATCATGT ATCT CAATTCTTT AAG AAAT C C C A 
TTTTGCATTTCATG CCTTTTGAAGAGTGCATCACGCACACG CG CTTTTGGTGGTTTTTATCCACTAAAGTGGAAAAATTAG C 
GTTT^AAACGATGATAACCCTCAAATTTTTATCCCTGTAGCGGAGTGA 



HPN013 

ATG AAAG C GTTG AAG ACTTl^lTT AAAAAAAT C C CTT ATT CTGTT ACT AG CAATTG C CTT AAAC CACTT AAA CGCTGTGG CT A 
TG ATTGTGG AT AATCCT ACG CAGAACGCTTGG AATGGTGCTAAAAGAG CATGGGATGAAAGCAAGTGGGCT AAACATTTAGC 
CACTATTACTGAAAGGATCAAGCTCGCTCAAGACACATTAGATAGGGCTAATCAGAC^ 

GATG TTTTG AACAAAACCAAT CAATTT CT AACAGG CAGT ATTTT AAG CATC C C CAAT C C CATGCAGTATGT AG AAAAAAT CC 
AAAGTTTTG CCAAG CAAGTT CAAG C CAAT ACTG AAAGGAT CAAAG AAAATGCACAAAACT ATGAT AT ACG CAATCAAATTGC 
AGCCAAACGCAT CT CTG AAAAATGCC CTG AACTCAATTGGG ATGTCAGTCAAG ACG CG AG CCCTACAG AG AAAAACTTACA C 
CAATTTTTCA CG AG CAAGGGG AAAGAAAG CG CT AA CACAAAGG CT CT AAAGG ATTTTGCTAACG C CATAGGT AACACTCAAA 
T CAGCACGG CG AACG ATTT AGG AGCTGG ACTT AGAGGCAGAG CCTTATT AG AAT ACATC CAATTT AG A 
AGCGGCTAAAAAAATCCAATTATTAGACAGCCAAATGACTTTAGCT 

AGAGCTGAAAAAGAAGAATTAAAAAGACAAATCGCTTCAAATGTGTATGCGAAAGTCAA^ 
ATAGAGOSTTTAGTCAAATGGATAATGAGTTGGGCGTTAAAACTTTTGGGTTCAACG^ 
CAAGAAAGAAAACAGAAATCGCAAAAGCGAGTCCATCCCTAACATGCT 
CTTAATTTAGATTATAGTAGGGATATTGCTGGTAAAAAAGGTGAA 

T C CAACAATT AAG CGTAG AAACTG CTTT AG AAAT CG CTCAAAATTT AAG TTTTATG AAT AAG ACG CT AGGTTT AATGGTG CA 

AATG CAAAG CT ATG CATTCAAGCAACAAATGGG CT ATTTTG AAG AT ATT ATT CCTG CTG AC G CCCTAAAAG ATGACAAAG AG 

GATGAAGAAAATCITGAACAAAAACAACAAGAAATAGAGAAAGTCTAT^ 

GTAGTGTAGGAAAGGGAAGTGGCGTGAATTCAAATAGTAATAATGAAGCCCC^ 

GTATTGA 



HPN04 8 

GTG CAAC CGATG AAAT CTAAAAAACTTT ATTTGG CTTT AATCATAGGGGTTTT ATTAG CGTTTTT AACC CTATCTT CATGG C 
TGGGTAATAGCGGTTTAGTGGC^CGTTTTGGGGTGTGGTTTGCCGCAOT 
TAATTTACCCTATTTAG CATGGGTTTTATTCCTTTTATACAAGACTAAAAACC ^ 
TTAGGGCATCTATTAGGCATTTTATCTTTGCTC^ 

G TTTGTTTTT ACG C C CTTTT AT AGGGG ATTTTGGGCTTT ATG CG CTG AT AACG CTT ATGG T AGTTATTTCTT ATTTGATTCT 
ATTCAAACTACCCCCTAAAAGCGTTTTTTATCCTTATATGA^ 
TTACAAGCCTTTAGCCCTAATTTTAGCCCAAAAAAAGAGGG TTTTG 
AAAACGACAAAGAAAAAGAAAACCGCAAAGAAAACCCTATTAATCAAAACCACAAAAC 

GATC CCTACCCCCTATAACACGACTTTAAATGATTCAGAGCCG CAAGAAGGCTTAGTCCAAATTTCCTCC CACCCCCCTACC 

CATTACACCATTTACCCTAAAAGAAACCGATTTGATGATTTGACTAACCCCACT 

AAACTAAAGAAAGAGAACCCACGCCTACAAAAGAAACTCTTAraCCCACCACGCC 

CATAATAGAAAATGACAACAAAACA.GAAAACCAAAAAAC CCC CAAC CACC CT AAAAAAGAAGAAAACC CACAAG AAAACACG 

CAAGAAGAAATGATAGAAGGAAGGATAGAAGAAATGATAAAGGAAAATCTAAAAAAAGAAGAAAAAGAACT 

CAAACTTTAGCCCAGTAACCCCCACAAGCGCTAAAAAACCCGTTATOT 

CGGATTGGATTATGGCGAAGTGCAAAAACCCAAAGATTAT<^GCTTCCCAC 

GACACTTCTrrAGACGAAAACGAGATTGACGAAAAAATCCAGGA 

ATATTATCCGCACTTATTCAGGCCCTATTtSTAACCACT 

AGGCTTG AGCG ATGATTT AGCG ATG ACTTT ATGCG CH3 AATCCAT C CG CATTCAAG CCC CT ATT AAGGGTAAAGATG TCGTT 
GGCATTGAAATCCCT AACAGCCAAAGC CAAATTATTTATTTAAGAGAAATTCTAGAGAG CGAATTGTTTCAAAAATCCAGCT 
CGCCCTTAACTCTAGCTTTAGGCAAAGACATTGTGGGTAACCCTT^ 
CGCTGGCACGACAGGAAGCGGTAAGAGCGTGGGCGTGAATGCGATGATTTTA 
CTCAAATTAGTGATGATCGATCCCAAAATGGTAGAATTT'AGTATTTATGCGG 

CCGACCCTAAAAAAG CTATTGGGGCTTTG CAAAG C GTGGCTT AAAG AAATGGAACG CCGGTATTCTTT AATG AG CGAATACAA 
GGTTAAAACCATTGATTCTTATAATGAACAAGCCCCAAGTAACGGCGTTC 

GAATTAGCGGATTT AATG ATG ACAGGGGG CAAAGAAGCGG AGTTT CCTATCGCTAGAAT CGCTCAAATGGGG CGCGCG AGCG 
GCTT ACACCTCATTGT AG CG ACCCAAC<3 CCCAAG CGTGGATGTCGT AACCGG CTTG 
GAGTTTTAGGGTAGGCACTAAGATTGATTCTAAAGTGATTTTAGACACT 

ATCCTCTTTACCC CCCCAGGAGCGAACGGGTTAGTG CGCTTG CATGCCCCCTT^TGCCACTGAAGATGAAATCAAAAAAATCG 
TGGATTTTATT AAAG CCCAAAAAG AAGT ACAAT ACG AT AAAGAl'rrCrrG CTAGAAG AATCACGCATG C CTTT AGACACCCC 
TAATTATCAAGGCGATGACATTTTAGAAAGGGCTAAAGCGGTGATTT^ 
CGCCAATTAAAAATCGGCTACAACCAAGCCGCTACCATTACTGAC^ 
CTAAAGGCAACAGAGAGATTTTGGAAAACTTTTAA 
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HPN091 

ATGGG T AAT GATTTTTCT AAATT AGG ATTTGTTTT AG C CG CATT AGG AAG CG CGAT AGGTTT AGGG CAT ATCTGG CGTTT C C 
TATCGCTGAAATGCTATTAGGACAAAGCACTCAAAAAAATGTAACAGAAGCTTTTAAAGAGCTTG 

CGCTGGAAATACGCAG<MCTTTTGCTTGTTTCTGGG CCATT AATACTG ACTTTTTACGG CACG ATTTTAGGTTGGGTGCTTT 
ATT ATTTGG TG AGTGTT AG TTTT AATTTG C CT AAC AAT ATCCAAG AAT CTG AACAAATTTTT ACT CAAACT^ 
AGGGCTACAATCCATAGGGCTTTTTAGCGTTTTATTGATAACCGGATGGATTGTTTCTAGGGG 
AAGCTCAATTTGGTTTTAATGCCCTTACTCTTTGCTACTTTTTTTG^ 
CTAAAGCTTTTCATTTCATGTTTGATTTCAAACCAAAAGA 

CTTTTCCTT AAG C^TCGGTTT AGGG ATCAAT AT CACTTACGCTGCGGTTACGG AT AAAACGCAG AATTTG 

ATTTGGG TGG TTTT ATCAGG AATT CTAATTTCTCTTGTGG CAGGACTT ATGATTTT CA(TTTTTGTGTTTG AATATGGGG CG A 

ATGTCTCACAAGGCACAGGGTTAATCTTCACrTCTTTACCGG 

GATTCTTTTCTTGCTCGCGCTCGCTTT^GCTGGCATCACTTCTAC^ 

GAAAGGTATCAATACTCTCGTTTTAAGGTTACTTGGGGTCTTGTAGCACTA^ 

CGCTCCATAAGGATTATAAAGATTATCT^CTTTCTTTGAAAAAAG 

TATCATGCCTTTAGGOGGGATGGCAACCTTTATT^ 

CACTTTTTAGGCCCTAAATTCTTTGCAACITCG 

TG AG CAAG ATTTATT AA 

HPN132 

GTGGTCTTTAAAATTTTAGGTTTATGGTTAGGGGTGTTTTGTTTC 
CTAAATATAAAGACAATTTCACGCATTTTGAATACGCTAACCCTAACGC^ 

AGGGA CTTTTG AT AGCCTT AAC C CTTT CGCG CTTAAAGG CACT AAAG CTG AAGGCTTGG ATCTG ATTT ATGACACTTT AATG 

GTGCAAAGTTTAGACGAACCTTTTGCCGAATACCCCTTGATCGCT 

TTTTTAC13ATAGATAAAAGAGCGAGATTTAGCAATAAa3CT 

CATGAAATTAOTATCGCCTATTTATAGGCAGTATTACCAA 

TTCATTTTCAAAACCACTGAAAATAAAGAGTTGCCTCTCATT^ 

AGGATTATTTTGAAAAAAACCCCTTACTCATTCCTGTTTCTAGCGGCCCTTATGT^ 

AATGACCTACCAAAGAAACCCTAATTATTGGGCGAG-GAATTTGC 

TTTGAGTATTACAAAGACGAAACCATCGCCTTACAGGCTT^ 

AGGTTTGGG CTAGGGG CTATGTGGGG AAAG ATGGACAAT AAAG AG ATTACGAAATATTTG ATAG C C CACAAAATG C CAAG 
CG GCAT GCAAGGGT1U"1TC1TCAACACGCGCCGAGAAATT^ 

G ATTTTG AATGGG CG AATAAAAATTTGTTTTTTTCG CAAT ACAAGCGCACCACCAGTTTTTT CAGT AA CT CT AT CTATG CGT 

CCCCTCCCCTCCCAAGCCCTGAAGAAAAAGCCTTGCTAGCC^ 

CTATCTCGTGCCTAGAACCGATGGAGTTGATCTTTTAGGCTATAATTTGAGG 

GAAAATTTAAAATACGCCCAAAAGCTTTTAGAGAGCACGGGC^ 

AGCCTTTCAGTTTCACTTTGCTTTTAAATAGCCCGGCA 

AGGGATTGAAATGAAAATCCAAAGAGTGGATTTAAGCCAGTATGTCAATCGGAT 
GGAGT^TTGGCCAATCGTCTTTCCCAGGTAATGAGCAGCGCT^ 

GGAATTATGCGGGAATCTCTAGTAAAGCG^TAGATGATTTGATTGAAAAAATCATTA^ 

GGCCGCCAOTCJUVGCGATGGATAGGGTATTGTTGTGGGGGTTTT 

GCAGCGTATAATTAGATTGGCATCCCTGAAATCAGCCCTAGCT 

ATCTTCAATGA 

HPN137 

ATGAAAAATCAACACAAAAATCCCCTAACAAAAGCTTTAATGAAAACT^ 

TTCTAGG AG CG TTTTT ATT AGG TTTG CT CAGTC CAGCTTT ATGCTTTAAGT ATTAT CACC^CT AAAGA 
GCTTAATGGAGCGATAGAAAGCAGGGTGGTGTTAGGCAAGAGGGTGTTTAAAG 
AATGCGACTAACAGCATAGATATAGAAATCACCAGTCTTTTAAGAGACA^ 
CCAGTTTAAAAATACCTCCTAACGCCAAGATTAAAAAATCCACT^^ 

T AAGATTTT AGG CGTTAGCAAAGAAG AATAC CAAAAGCTAGAAAACAT CGCTCAAACCAAAG CGG CT AATG ACCCTATG TAT 

GCTAACACGCCTTTTAGTAATGGTTCTGATAGTTCCTT^ 

GCAAAGATGGCGCAAATCGGAGTAACGGCTATGGGGCAAATGGCAAT^ 

AAATGGGAGTCATTCAAATAATAATGCAATAGGCAGTGGTATTGATACAGATGCC^ 

T CT AGTTCTT GAAGTGG C<^ CTCTGT AGGG-GGTTATGAGAATAATTTCACTAATC^ 

GGTATGAC^ATTTTAATAAT<MCAGCTCJ^^ 

AGACACAAACAATTCCAATAATTCCACTAACACCACTAGCCCAACTAAT 
TCGCAAGAAAACAATTACTCCAGCCAGTATTGTAAAGTGCCAGAGTTAAGCC^ 

CT AAAGATGG CT CTTGTATTTCT ATG AACGCTTTAAG AGATGACACT AAATG CGCTTAT AG ATACGATTTTGAAGCCGGT AA 

AGCCATCAAGCAAACGCAATACTACTATGTAGATAGGGAAAATAAAACGCAAAATATCG^ 

GCTCAATACGCCATGCAACTTTACAAAGATGACAGCAAATGCGC 

AAACGCAAACCTTTCAAACTGAAATCGTGTTTCXSTGGGATGGACAATT^ 

AAGGGTGCAAGACAGGATTGTTAGGTATGAAAAAAATGATAAAACCCIAAACCTTAAC 

GATCCTTAACAACCCTAACAAGCAAGAGATTTTAAATCGTGGGATTGCCA 

GCX2GTCAATGGG AATACAATGACG CTAAATTAGAAG CCAAAAGAC CT ACAATGCT AAAAAGCTAT AACAAG CTTAATGGAG A 

ATGGGTAGAAGTT ACG CCCT<^AATTTTGAAG CAGGG ATTAAAAGCGGTG CGGTTGTT AG C CCTT ATGTGATGGGCGTG CCT 

AGTTCTAAAGTCITAAGCCATATTACTAOU^GCCATTATTT^ 

AAAAACnTTATGGAGTCAATCGTTGCCAACCGCAATATTCCATACTGATCCT 

ACCACTACCACCCAAACCACTCAACCTTATTTACGCCCAGCCCAAGATAATGA 

CCACTCAAACCACCATCAACAGGACTCAAAGCGTTTTGA 

HPN172 
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ATGTTGGGGAGCGTO^AAAAGCGGTTTTTAGGGTTTTGTGTTTGGGGGCGTTGTGTTTATGCG 
AAGATCCTAAAGAGCTTATATTTTCAGGTATAA 

AG CTTGCAAAT CAAA CG ATGCTG ATGG CTGTG CAAT CTTAAG AG AGGTTT ATT CT AGTGG T AAAG CCAT AG CG AG AG AAAAC 
GCAAGAGAGAGCATTGAAAAAGCTCTTGAACACACCX3CTACTGCTAAAGTTTCTAAATTAAAC 

ACTT AG C AG AG TTTTATTTT AATGT AAACGAT CTT AAAAATG CTTT AG AATATT ACT CT AAAT CTTGTAAG TT AAAT AATG T 
TGAAGGGTGTATGCTGTCAGCAACTTTTTATAACGATATGATAAAGGGTTTGAAAAAAGATAAA 
TCTAAAGCTTGCGAGTTAAATAACGGTGGAGGGTGTTCTAAATTAGGAGGGGATTATT^^ 
ATTTCAAAAAAGCTTTTGAATATTCTGCCAAAGCTT^ 

T AATG AG^GGTAAAGGCGTGGCAAAGG ATG AAAAGCAAACX3 ACAG AAAACCTTGAAAAG AGTTG CAAG CTAGG ATTAAAAGAA 
GCATGCGATATTCTCAAAGAACAAAAACAATAA 
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HPC004 

ATG AAT AAAAACAACAACACG AAT CTT ATTTT AG CG ATCG CT CTGTCTTT CTTG TTT AT CG CTCTTT AT AG CT ATTTTTT CC 
AAAAACCAAACAAAACAACAACCCIAAACCACAAAG CAAGAAACAG CCAACAACCACACAGCAACAAGTCCTAACG CG CCCAA 
CGC CCAAAATTTTAGCGTTACT CAAACCATCCCCCAAGAG AGTTTGTT AAGCACG ATTTCTTTTGAG CATG CCAGG ATTGAA 
ATTGATTCTTTAGGGCGCATCAAACAGGTTTATCTCAAGGATAAAAAGTATCTAACCCCT 
ATGTGAGCC^TCTTTTTAACCCCAAAGCTAACCCGCAACCC^ 
GCCTTTAGAAGTGCGTTTTTTAGACCCCACGCTCAATAACAAAGCGT^ 

GGG C CT AATG AACAG CTTG TTTT AAC C CAAG ATTT AGGCG CT CTT ACCAT CATT AAAA C C CTG ACTTTTT ATG ATG ATTTGC 
ATT ATG ATTT AAAAATCG CCTT CAAAT CGC CT AAC AAT ATT ATCC CT AG CT ATGTG ATCACT AATGGTT ACAG AC CGG TGG C 
TG ATTTGG ACAG CT ACACCTTTT CGGG CGTGCTTTT AG AAAACAACG ACAAAAAAATTG AAAAAATTG AAG AT AAAG ACG CT 
AAAGAAATCAAACGCTTTTCTAACACCCTCTTTTTATCCAGCGTGGATAG^ 

CTCAAGGTTTTG AAGC CTT AATTG ATT CAG AAAT CGG CACT AAAAAAC C CTT AGGG TTCATTTC C CTT AAAAATGAAG CG AA 

TTTGCATGGTTATATTGGCCCTAAAGATTACCGCTCT 

TTAATCACTTTCTTTGCGAAAGGCGTGTTTGTTTTACTGGATTATTTC 

TTTTTTT AA CGATT ATCGTGCG CCT AATCCTTT AC C C CTT AAG CT AT AAAGG CATGGTG AGCATGCAAAAG CTCAAAG AATT 

AGCCCCGAAAATGAAAGAACTTCCAAGAAAAATACAAGGGCGAACCCCAAAAGT^ 

AAAGATGGGGCGAACCCGCTAGGGGGTTGTCTCCCCTTAATCT 

AT AACG CTGTGG AATTG AAAAG CTTCAG AGTGG AT CTT ATGGATT CATG ATTT AT C CATCATGGATCCGT ATTTT ATTTTAC C 

GCTTCTTATGGGAGCGTCTATGTATTGGCACCAAAGCGTTACGCCAAACA 

AAACTCCTACCCCTATTATTTACAATCTTTTTAAT 

TTTCGGTGTTGCAACAACTGATTATTAATAAAGTTTTAGAGA^ 

A 

HPC010 

GTGAGGCAAGAAAAGTATTTTTTGACTTCTTCTTTATCGCTT^ 
GGTTTAGTC^TCGTGTGGAGAACTTTTCTAAGATTGGTTT^ 
TGAAAGTTTTATAGATATTGTAACTTTAGCACAAGTCAAAGTCAATT^ 
GTT/TCTTTGGGTGGGGCGATTGCAGCCATTCCTTACGATAAGACT 

G CTCAATTGTGGAGAATTTCATTGGGGG CTATCATGGATACTTTTTTAACAAGTATCTTGGCCCTGCTTATGCGG 

TCAATCAG CGAG CTAT CATG CAAGG C CTT ATGTGGTGGAT A C CG CTTTTTT ACG AT ACG ATT ACAAAGATGTTTTTGGG TTT 

AAAGOSGGGCGCTATGAAGCGAATATTGATTTCATC^ 

CTGAGACGGAAAGGTTAAGGTTT'TG^TGGTGGAGTTCI^^ 

CGCGACCGTGCCTTATTTGAAAAAGGGAGGCAATCCTGATAACAGGAAC^ 

ACAACCTATTCTTATAAAGrGTTTAGACGCrrCAATTTTTTTATATT 

HPC012 

ATGAATTTTTTTAAAATCCTTTTAATC 

CTTTAATCTATGG CTTG TT AT ACCCTTTGCCTTATTT AAAAG ACATCGT AACG CAGCAAAAAAT CG C CCTTGT AG ATG AAGA 

CAATTCCTTCCTTTCTAGGCAATTAGCCITCA^ 

CTGG AAGCCAAAAAGCTTTTAAAAGAAGAAAAAATTTATGGGAT 

AGCAGGTGCCTGTAACGATAGATTTTTATGCGAATTCCAATTACn^ 

GAGCATCAACGCTTTAAATGATGAGATAAGATTCAAACGCAAC^ 

AAAATCAGGCCTATCGCTTTGTATAACCCTAGTX3AGG 

AC CAGGTGATGCTCATTG CAAG CAG CATGTTTACT AG CTCTAGGCG TTTGGAATT AG CCCITTTAGAT AAAAAG CAAATCG C 

TTTAAGGCTCTGCGCAAGACTCFrGGTGTTTATC 

TTTTATGGGATOGAACGGCATGCGAGTGCTTTAATG^ 

GATGGGTTTTGTGTGGCCTTTTGAATCCTTGCCCT 
AGTTTOTTAGGGCGATTGAATCAAATGC^TG CGG AATTTATAGA 
TTGCGAGTTTTATAGGGAGTGTCTTCAAACTCAGCT 

HPC013 

ATGAAAGCGTTAAAGATTTTTTTAAAAAAATCCCTTATTCTC 

TGATTGTGGATAATCCTACGCAGAATATCTGGCAACAAGCAAAAGACGCT 

TCATTGGGCTGACCAAATCAAAAAATACCAAGATATGATAGAAAAAGCTCAA 

GATATTTTACreAAAACCJATCAGTTTATGAATGGTTCrAl 

CTCAAATTGCCAAGAATGTAAAGTCAAAaSCTCrrCGCCCTACAAGA 

ATTACGAAATATTGCTAGCAAATGCCCTGAATTAGATATGAATA 

AAGGGAAAAGAAAAGAGTGCCGCTAGACJUVGCTTTAGAAAATTTAGCT 

AACIAT AT AACAACZAAGTTT AAGTGGTAGGGCTTTY AG CAGACTTYATTTG CAAAACAAAAGAGCAAG AACTTTTAG CAGA YA 
AAAAAGCAACAATACCTAG 

HPC024 

ATGATGTrrrCrrC^TGTTTGCTTCGTTAGGGACTCGTATC^ 

TTTTTATTGGTTTTG TAAAGGTTATGGAAAAAGATGTC CGCAACT CATGGAGCATTTAGAAACCGGG CAAT ACAAAAA 

GCGTGAAAAAACGCTCGCTTACATtlACAAAACTTCTTG 

GCAAGAAAAATGGCGTTGGATTATTTTAAACGCATGAAC^ 

GGGTGGTGCTGTTTGATCCG 

HPC034 

ATGAAAAAATTGGTTTTAATCATCTTTTTAACGCTAACACT^ 
CTTCAGACATTCATGGGCGGCrTTTTTCGTATC 

GACTTTAATCAAAAAG CAAAGGG CTG AAAATAAAAATGTGGTTTTGATTG AC^GCGGGG ATTTCTTG CAGGG CAAT AGCG CG 
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GAGTTGTTTAACGATG AGCCCATTC ACCCG CTCGTTTTAG CCGAAAACG ATTTG AAATTTGATATTCGTGTG CTTGGG AATC 
ACGAGTTTAATTTC^GTAAGGATTTTTTAGAGAAAAACATTAAGGGGTTTAATGGTGATG 

G ACT AT AG ACAAT AAG C CGTTTGT AAAG C CTTATG CAATT AAAACAATTG ATGG CG TGAGGG TGG CGG TTG TGGGG T ATGTG 
GTGGCGCACATCCCCACTTGGGAGGCCGCTACGCCTGAACATTTTGCAGGTTTAA 
AAAAGACTTTGAAAGAGCTAAAAGGGAAGTATGATATTTTCATTGGTGCT 
CGACGGAATACCTGATCTGGCGAAAAAATTCCCGCAATTTGACAT»T^ 

AAAATAGGAAAGGTGCATACCATTGAGCCTGGAGCGTATGGGGCTTATCTGGCAAAAGGCGTGGTAG 

CGAAGAAAAAAATCGTAACGACTGAAAATTTACCCACAAAAGGCGTGCCAGAAGATGAAGAATTAGCGAAAAAATATGAATA 

TCTGGATAAAAAATCAAAAGAATACGCTAATCAAGTGGTTGGCGAAGTTACAAAAACOT 

ACAGGAGGAGAAAAAATCACTACGATGCCCACCGCCGCCTTGC^GAAACACCGGTGATAGAATTGATCAA 

AAT ATT ACG CAAAAG C CGATGTTTCAG CGG C CGC CTT ATT CAATTTTGG GG C CAATTTG AAAAAAGGGCCTTT CAAAAG AAA 

AGATGTCGCCTACATTTACAAGTTCGCTAACACGCTCATTGGAG 

TGGT CGTATCAATTTT ACAAT CAGTTGCAAC CAGGCG ATTT AACGAT CAG TTTT AATG AAAATATTCG TGG TT AT AACTTTG 
ATATGTTTTCTGGCGTGAAATACCAGGTTGATGTTACAAAACCCGCC 

HPC03S 

TTGGGTATCAAT ATGTG TT CT AAAAAAAT AAG AAATTTCATTTTATG CTTTGGTTTT ATTTT AAG CTTG CACGCTG AAG AG A 
GTATGACnTOS ACTG AAGAAAAT ACCC CT AAAGACG CTC C CATT CTTTTGG AAG AAAAACG CG CC CAAACG CT AG AGTTTG A 
AGAAAACAAGGAAGTTAAAAAGAATATTGATGAAAAAAGCCTGCTTGAAGAAATCCAT 

CT (ZAAAGGG^ AATTGCATGAAAAAAAT<3 AATCCATTTT ATTC CA CT AAAAACAAGAG CGG TTTTTTTATAGG CG 
TAATTCTTGGCGATATAGGGATTAACGCTCATCCTAACACCCGATCTTATC 

TTCT C CTTT ATTGT ATGG CTT AAGGAG CGGGT ATCAAAAG TATTTTG CT AACGGG ATT AG CG C CTT ACGCTTTTATG GGG AG 
T ATTT AGGGGGGG CG ATGAAAGGGTTT AAAAGCG ATT CTTT AG C CTCTTAT CAAACCG CAAG CTTG AACATTG ATTTGTTGA 
TGGATAAGCCTATTGATAAAGAAAAAAGGTTTGCGTTAGGGATAT1TGGAGGCGTTGG 

AAATTT AAAAG AG ATT AAAGGGT ATT CACAG CCT AACG CTTTTGGATT AGTG CTAAATTT AGGGG TG AG CATGACG CTT AAC 
CTCAAACACCGCTTTGAATTAGC CTT AAAAATG CCTCCCTTAAAAG AAACTT CG CAAACTTTTTTAT ATT ATTTT AAAAGCA 
CTAATATTTATTATATTAGTTACAACTATTTATTGTAA 

HPC039 

ATGTCAGAAAAAG AAAG ACTG AATG AAG TGATCTT AG AAG AAG AAAAT AATGGGGG CGG CACT AAAAAGG TGTTTTTG ATCG 

TGG CT ATAGCCATT ATCATTTT AG CGGTGCTTTTAATGGTGTTTTGG AAAAG CACG AG AG T CGCTC CT AAAG AG A CTTTTTT 

ACAAACCGATAGCGGGATGCAAAAAATAGGCAACACTAAAGACGAGAAAAAAGAC 

CCTTCCAAGCAAGAAGACAAGCTAGACAAAGTAGCGGATAATG 

AAACCAATCAAACTCAAACXSGAGATGAAAACAGCAGAAGA^ 

TAGCGCTCAAAAAGAATCTCAAGCTGTGGCTAAAAAAGAAACCCCCCA 

GCTCATAAAGATAAAGATAAGCATGCGGTTAAAGAGCTAAAAGTCAAAAAAGAAGCT 

ATTCTAAAACCACTCTTACTAAAGGGCATTATTTGGAA^ 

GTTTAACCAATTCCCCCATAAGATTGAAGATAGGGGAGCAACGAAGCGCTATCTCATA 

GC CTT AATGCATG CTGATG AAGTCAGCAAAAAG ATGACT AAACCGG TTGTCATAG AAG CG CATT AG 

HPC048 

ATGAAATCTAAAAAACTTTATTTGGCTTTAATCATAGGGGTTTTATT 
GCGGTTTAGTGGGGCGTTTTXSGGGTGTGGTrTGCCGCA 
CTATTTAGCGTGGGTTTTATTCCTTTTATAGAAGACT 
CTATTAGGCATTTTATCTTTGCTCTTTTTACAATCTAGCCTATTG 

T ACG C CCITTTAT AGGGGATTTTGGGCTTTATGCG CTGAT AACG CTT ATGG TAGTTATTTCTTATTTGATTTTATT CAAACT 

ACCCC CTAAAAGCGTTTTTTATCCTTAT ATGAACAAAACACAAA^ CAATGCCT ACAAG C C 

TTTAGCCCTAATTTTAGCCCAAAAAAAGAGGATTTTGAAAA 

AAGAAAAAGAAAATCTCAAAISAAAACCCTATTGATGAAAACCACAAAAC 

CCCCTATAACACGACTTTAAACGATTCAGAGCCGCAAGAAGGCT^ 

ATTTACCCTAAAAGAAACCGATTTCATGATTTGACTAACCCCACTAA 

AAAGAGAACCCATGCCCACAAAAGAAACTCTTAOSCCCGCCACACT 

TGCACCCAACCTAGAAAATGACAACAAAACAGAAAACCAAA^ 

AGCCCACAGGAAAACCCACAAAAAGAAAATCAAAAAGAAAATATAGAAGAAAAAGAAAAT 
CGCAAAACGCTCCAAACTTTAGCCCACTAACCCCCACAA 

AGAG AT ATT AGACGGATTGGATT ATGGCGAAG TG CAAAAAMCC CAAGATTATGAG CTTCCCACCACG CAATT ATTGAATG CG 
GTTTGTTTGAAAGAAACTTCTTTAGACGAAAACXSAG^ 
AAATTGATGGCGATATTATCCGCACTTATTCAGGCCCTATTGTA^ 
GAGTCGTATTTTAGGATT<1AGCGATGATTTAGCGATGACTTTATC 

AAAGATGTCGTTGGCATTG AAATC CCTAACAG CCAAAG C CAAATTATTT ACTTGAG AG AAATTTT AGAAAG CG AATTGTTTC 

AAAAATCCAGCTCGCCCTTAACTCTAGCTTTAGGCAA^ 

CCATTTGCTCATCGCCG 

HPC050 

ATGAAAAAACCCTACAGAAAGATTTCTGATTATGCGATCGTGGG 
GTAAGAGCAATGCCGATGACAAACCCAAAGAGGAAAGCT 

AGAG CAAAAGG ATAAATCTT AGAAGGTTGTTG AAG AATACCC CG CG ATTTG CAAGGC 

AATGAACG CGTGTTG AG CAATGAAGAGATT CAAAAGCTCATTAAAGAAG AAG AGGC CAAAAT^ C 
TTGTTCAACCTAATAATGGAGGGAGTAATGAAAGCTCAGGCTTTGGC^ 

GATTTTAGGG AGTTATATTGGCAATAAG C TTT TCAAT AAC C CTAATTATCAG<IAAAACGCC CAACGGAC CTACAAAT CCCCA 

CAAG CTTACCAACGCrCTCAAAATTCCTTTrCT AAAAGCG 

GCGGGTTTTTTGGCTCTAGTAGACCTACTAGTTC^ 

HPC056 
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TTGTTTTTAGTCAAAMMMMT AGGCGTG AT AGTAGTGGTTTTAAT AGG CTTTCTAGCTTGCTCG CAAGAGAGGTTTATCCAAT 
TGCAAAAAAAAG CCCAAG AGC AAGAAAATG ACGG CT CT AAACGCCCT AG CT ATGTG G ATT CGGATT ATG AAG T CTTT AGC G A 
AACG ATTTTTTTACAAAACATGGTGT AT CAG CCT AT AG AAG AAAG AG ATT CTTT CG CC CAACTG ACTAAAG ATGG AG ACG AT 
TCTTTTAACCCCGAAACTTCGGTGATTTTATTGAATCAG 
AGTCTAATACTAACACTGCCAATAACGATACAAAAAACCCGTTCCTT^ 

C ATT G AAT ATT C C CAAC AAAATTT CT AC C CC CT AAAGG ATGG GG AT ATT AT CATG AGT AAAG AAGGGG AT CAATGGTTGGT A 
GAAAT CAAATC C AAAG C CTTG AAG CG TTTTTT AAAAGAT CAAAACG AT AAAG AT CG C CAG AT CC AAACTTTT ACTTTT AATG 
ACACTAAAACGGAAATTGCGCAATTTAAGGGCAAAATTT 
GCCTTTTTATGAATCGTTTTTGTTAGAAAAAAAGAGCGATC^ 

ATTTCAAAGTGTCAAATGGTGTTAAAAAAGCATTCAACCGATAAATTAGACAGCCAG 
ACTTTAAAAAAG AG CG CTTTAAGAG CG AT ACGGAACTTTTTTT AG AATG CCAAAG TT AG 

HPC059 

ATGAATTTTTTT AAAAT CCTTTT AATGG AATT AAG^G CT ATTGTTTCT CAT A CCTT ATAGG CG CT C 
CTTTAATCTATGGCTTGTTATACCCTTTGCCTTATTTAAAAGACA 

CAATT C CTTCCTTT CT AGG CAATT AG C CTTCATGGCGCAAAGCT C CAACG AG TT AGAAAT CG CTTTTTTTAG CC C CTCT ATG 

CTGGAAGCCAAAAAGCTTTTAAAAGAAGAAAAAATTTATGGGATCT^ 

AGCAGGTGCCTGTAACGATAGATTTTTATGCGAATTCCAATTACTTTTTGATTT^ 

GAG CAT CAACG CTTT AAATGATGAGAT AAG ATT CAAACG CAACG C CCAAAT AG AAG AAG CTG AATT AGGG ACAGACGGG ATT 
AAAATCAGGC CTATCGCTTTGTATAACCCTAGTGAGGGGTATTTGAATTACGCG CTCTCTAG CGTGTTTATTTTCATCTTAC 
ACGAGGTGATGCTGATTGGAAGCAGCATGT^ 

TTT AAGG CTGTG CGC AAG ACT CTTGGTGTTT ATGG CAG CGTTT AG CGTTTTTGTTTTGTTGT ATTTTGGGGCGCTGTTTT CT 
TTTTATGGG AT CG AACGG CATG CG AGTG CTTT AATGGTGTTTTTGAAT AG CT CCAT ATT CATG CTTGCAACCTTG AGTTTGG 
GGTCGTTTTTAGGCGCATGGATCAAAAATGAAGCCCACACCACTGAAATCG 
GATGGGTTTTGTGTGGCCTTTTGAATCCTTGC^ 

AGTTTGTTAGGGCGATTGAATCAAATGCATGCGGAATTTATAGATGTTTCTGTCC^ 
TTGCGAGTTTTATAGGGAGTGTCTTTAAACT CAGCTCTTTAAAGAAAG CTTGTG AAAACG CTTAA 

HPC063 

GTGCGTTTGTTTAGATTTGT<3GGGTGGTATTATTTCAAATACTTTTT 
GCATTGACAGCTTGAAATACGCCGATAAAATGCCTGATTCT^ 

CGC CCT CAATT ACAC CTTGCCCATTTC CTTGCTTTTGG CG ATGGTTTT ATTTT ACAT CACCTTCATTAAATCC AACCAAT AC 

ACCGCCCTX3CTCTCCATTGGCTTTTCCAAATGCCAGATTT^ 

ATGTGGGGTTX3AACGCGAOTCCTTTTX3TGTATATGGA 

TTCAGAGCATTTGTTAGTGAAATATAACGATGATTACGTGTATTTTGATA^ 

ATCAAGGTTTTTCGCCTAAAAGATAAGACTTTGGAATCT 

TCTTGGATGACACTACTATCTATCAGATGCCCTT^ 

CTTTAAAACGCTCAAAAATTTCCGCCCTAAAGTTTTAGACA 

CTTTTATCCTTGCATCCTTTAGTGCGCCAAAAQ3CGGACA 

C C1'T1 W 1 T 1 ^TGCCGTTTTTAAGCGTTTTAATCGCT^ 

GCTAAAGTTTATCATTATCACGCTCGTTGTTTGGGGGCT 

CCTGAAATAGGCGTTCTATCGCCCTTTTTCGTAT^ 

AG 

HPC068 

ATGAAAAAAAGAACCCTCTTTGTATTGGGCTTAT^ 
CrrcrrC w rri^AATTTGGCTGAAGACAGCACACCCTTGAA 

TAGGGTGTTATCCAAC CATG AAGG CTTG CATG CG CAAG AAT ACGCCATT AAAAG AGCGAGT AAAATG AAATT AGCGGCT AAG 

AACAACCGGGCGTCCAAAAAGCCACGAACCAGATCCATCAAGGCT 

AACCCCTCAAATCCAAGCGGGCATGCAAGGGGTCATCCAAGGGTT^ 

TTTTCTAAGCAAAATGTGGTGATTCGGGCTTTGAGCAT^ 

GCATTCCGGATTTGATGCAAAAAGAOSCCAATGAAGTCT^ 

GTATTATGGCATGGTGCTAAAC<3CAGAAGTGGCTGAAACTTTAGAAGAGGTA 

GCTTTGAAAATGCAAAAAGTAGGGCAAATCGCTAGGGTAGAAACC^ 

CTAGCGTTAAGGCTAAAGACXSTGTTAGAAGTTTCGCAACTCTCGT^ 

CTCAAGCAAATTAGAGATCCACACCGAGAAAAATCTGCCCGATCTGAGCTT^ 

GCTTTAAAGACTTTAGAAAATCAGGTTCAAATTTCTAAAGAA 

GTTTTTTTGGCTCTTATATCATGAAG CAAAACAATTQ3GTGTTTG AAGACATGATC CCTAGTTGGT^ 

GCGCATGCSTATTCTTTCTCCCACAGGGCGTATCCAAAAA 

CAAATCOVAGCTAAAAAAAACATGGAATTGTTAGTGAATAAGACITATAAA^ 

GCITCCrrrCTAGC<riX3GAATTAGCCAAGGAAAACTTAAAA 

TCAAGTCATTGATGCGAGGAACACGCTTTCTTCTATCATCGTCGAGCAAA 

GCGAATTTAATGGCGTTAAGCGATCATATTGATTTATTTTATGAAT^ 

HPC069 

ATGGTGTTAGTTAAAATGGTGTTAGGGTTTTTGATCCTTTTAA^ 

ACATTATAGAGCGTT Ca^ AAATTTCCTCTTATTTGCGGGGA 

ACGCTCCAAAAGCCITGAAATCTCCAAACGATTAGAAGAGATTC^ 

CTCTTAAAAGAATTAGAGCAAGCCAAAGAAAAAGCTGAATTAAT^ 

AAAAATACGAATTGCAAACCAAAATGGATCTGGAAAATTTG 

GATCAAAAGAG AG CTGGTTGARAGCG'1 , '1 , T'I U I' KAAG ATCTAAG AGAG AG CAAAARAGT CTCTTTCAATG CG CAAGATTGCGTG 
AATATTTTGAVACAVAGGCTTTAA 
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HPC070 

ATGCTCG CTTC CATTATTGAATTTTC CTTACGCCAGCGAATAATCGTG ATTGTTGGCG CG ATTCTTATTTTGTTTTTTGGG A 
CTTATAGTTTTATCCACACTCCAGTAGATGCTTTCCCGGATATTTCGCCCACTCAAGTCAAAATCA1T 

TT CT AG CCCTG AAG AAATGG AAAAT AACAT CGTG CG CCCTTT AG AATTGG AG CTTTT AGG CTTGAAAGGG CAAAAAT CTTT A 
AGAAGTATTTCAAAATATTCTATTTCAGACATCACGATAGATTTTGATGACAGCGTGGATATTTATTTAG 
TTAATGAGCGCTTGAGCAG CGTG ATG AAAGATTTACCCGTGGGGGTTG AAGGGGG CATGG CG CCCATTGTT ACGCCGCT ATC 
AGATATCTTTATGTTCACTATTGATGGCAATATCACrGAGATAGAAAAACGACAGCTTTTA 
TTAAGAATGATTAGCGGCGTGGCGGATGTCAATTCTATTGGAGGCTTTAGCAGGGCGTTTTGTGATCGTGCCG 



HPC076 

AT GG CTGAAAATTCTTT CAAAAATGTTT C CACACAACC C AAAC CATTTTTCTT ATT ACCAG TTAAAAC C CTGTTT CTTTT AG 

GAGGCGTTTTTAGCGCGTTTTTTATCCI^GTTGCTGGCTTGGTTTTTTTTAATTACACT 

TAACTTGATGCGTTCAAACTCTTCTAACCCTATTTTAGATCAAACGCTCCGACGCGTTG 

G TGTTG C CTTTG AG CTITGTT AGTGGGGGTG TTTTT AAGCTTGT ATCG T AAAAATTT AG CACTTGGGG TGTGGTTTG TG CT AA 

GCGTG ATCTTATTTGAAGCCCTTTTAG AATCTTTAAAACACCTTTTGGCACACTC CATTCAATGGTTTTCG CACAGCGCT AA 

TTTCCCTAGCACTATCGCG C rTTC TT TGACGC^TTTTTA 

ATATTTCAAAACATTCTTCCTTATAGTTTGCTTGKTTTGATTCTTTTAATT 

TTAGCAGTGTTTTAGGAGGGTTTTGTTTAGGGGCGTCAGGGGCTTGTT^ 

GATCTAA 



HPC091 

ATGGGTAATCATTTTTCTAAATTAGGATTTGTTTTAGCCGCATTAGGGAGCGCGATAGG 

C CT ACATG ACTGGGGTG AG TGGGGG TGCTTTTGTTTT ATTG TTTTTATTTTT AT CTTT AAG CGTTGGCG CGGCG ATGTT 
TATCGCTGAAATGCTATTAGGGCAAAGCACGCAAAAAAATGTAATAGAAGCCTTTAAAGAGCTTGAC 

CG CTGG AAAT ACGCAGGG AT'l'l'TG CTT ATTTCTGGG C GATT AATACTGA CTTTTTACGG CACGATTTTAGG CTGGGTG CTTT 
ATT ATTTGGTG AGTGTT AGTTTTAATTTG C CT AAC AAT AT C CAAG AATCTG AACAAATTTTTACTCAAACTTTG CAG TCT AT 
AGGGTTACAATCCATAGGGCTTTTGAGCGTTTTATTGATAACCG 

HPC094 

ATGAAAAAGATTATTCTTGCATG CCTT ATGGCTTTTGTGGGTG CCAATTT AAGCGCAGAGCCTAAGTGGTATAGCAAGGC CT 

ATAACAAAACAAACACCCAAAAAGGCn'ATCTTTATGGGAGTGGTTCAGCC^ 

AGCGGATTTAGTGGCGTCTATTAGCGTGGTGGTTAATTCCCAGATCCAT^ 

TCCAGTGATTCGCAAACGATTAACTTAAAAACCGATGACTTGGAATTG 

AAGGGATCTACTACACCAGAGTAAGGATTAATCAAAACTTGTTTTTC 

GCAGTTTTCCACCTTAATGCCTAAGGTTTGTAAAGGGG TT TT TT TACAGCAAT 

GCGATGCCTATAGAAAGGATTTTAAAAGCGTATTCTGTCCCGGTGAGTTCGTTAGAAAATTATGAA 

ACG CTTTCAAACCTAAAGTG CAAAT CACTTTTG AT AACAA CAG CG ATACAG AGGAT ACAG AGATTAAAAACGCTCT CAT AAG 
TG CTTATGC CAG AGTG CT AAC CC CTT AG CG ATG AAGAAAAACTCT AT CAAATCAAAAATGAAGTTTTCACAGACAGCGCT AAT 
GGCATCACACGCATTAGAGTGGTTGTTAGCGCAAGCGATTGTCAAGGCACGCCTGTATTG 

AAAAG AATAAG AATTTTG CTATCACG CGCTTGCAAT CTTTG CTTT ATAAAGAATTGAAAGATT ATG CCAATAAAGAAGGG CA 
AGGCAATACGGGGTTATAA 



HPC09S 

ATGGCATTAAGGGTATTGTTATTCTTTTGTTTTTTGTTTTTA 
AAGAAATGGCTTTGGTGGATAAAAAACTCGCC71AA 

CCAAATTTATACCGAAAAAG AGAG CGTGAGG CAGG AATT AAGGCGTTTAAAAAAT AAAAAAAG CAAGGATTTATTAAAG ATT 
AG CACCTT AG AGCACACCTT AAAGG CTTT AG AATCCCAGCAAAAAATG TTTG AAAG CTATGGGGT CAATCCTTTT AAGGATT 
TG ATAGAG CGCCCCAATATCC CCAAT ATCC CT AAT ATCGCTAACCCT ATTG CAATCATTG ATGGCA TT1' CITT 'CATT AAAAG 
CATGCATTTAAAGCATGAAAGTCTTAAAAAAAACCAAACTT 
Cn*TTTAAATGAGTGGCACGCCTTGGATAAAAGCGTGAA^ 

TGCAAGGGGCTCAAAACATTTTAAAAACCACGATTGGGATTTTCCAAAAAGAC^ 

TCAAGTT AAAAACCAG Ci"lTTT AAATTG ATTT ATGTG1TT IT AGCAG C C Cri'T'l'G AGCGTGGTGTTTG CTTGG ATTTT AAAA 
ATCATTTCCAGTAAATACATTGAAAATAATGAGCGCGTC^ 

T CAl'U^I'I'AATCi i-iC'i"i"i"ri"l'CTTA'i.~l'"i , AGAGAATG TT ACTT ACTCGGTCACGGTTTT AGGCTTTGCGA^ CG CTGG CTT AG C 

GATTGCGATGAAAGATTTATTCATGAGCTTGCTCGGGTGGTT^ 

GTGCXSTATCGCTAAGGGGACGGATATTTTTATTGGCGATGTCTTG^ 

TAACCTTTACCACTTACACGAACAACAGGAGAGCGGGCCGGA 

TGCTAATTACAGCCATTTTGGGATGAAAACGGTTTGGGATGGCGTG 

G CITCT AAAATTGCGCTCAATATCGCT ACGG AATTC CT CAAT AAAATGC 

GCGACC^TATTCTTTAAGGAGTTTGAGTGTGAAGCCTCGATGCTTTTTC 

GTGGTATCAAACCAATTCGTATGCGACCATGTCTTTAAGGAGCAAGATTGTGGCTGAA^ 

GAAAATATCCATATCGCTTATACXjACCAGCAAGTTGCTTAAAGTG 

GGGAACAAAAATGA 



HPC099 

ATGCCGGAAAATTCTAAACTACAACCTGCTAAGTTAGGGAAA 
TTTCTCTCATT CTGT CTGT ATTGTT ACACTGGTTGATTTATTTTTT ATTTGA^ 
CAAGCTTGTTAAATTAAATCCTGAAAATTTATTGGTTT^ 
GCTCCTAAACCCACGCTGGCTGGCCCCCAAAAACCCCCCACT 

TAGAAAAG CCT AAACCTGAG CCT AAACCT AAG CCAAAAC CAGAAC C CAAAAAGCC CAACCACAAACAT AAGGCTCIT AAAAA 
AGTGGAAAAAGTGGAAGAGAAAAAAATAGTAGAGGAGAAAAAAGAAGAGAAAAAA^ 
GTAGAGCAGAAAAAAATAGAAGAGAAAAAACCTGTCAAAAAAGAATTTGACCCT 
TTGCXSCCACCCAGAAAAGAAAATAATAAAGGCTTAGATAACCAAACCAGAAGC^ 

TGGGGATTTAGGCACAGCCG AAAAAGATTTCATCAGGAATAATT^ CAAAAATATTTAG AA 
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TACCCTCAAGTAGCGGCTTATTTAGGGCAGGACGGGACGAATGCGGTAGAGTTTTACTTGCACCCTAACGGC 

ATCTT AAAATCATCATTGGCTCTG AATAT AAAATG CTTG ATG ACAACACTTT AAAGACCATT CAGATCG CTT ATAAGG ATTA 

CCCACGCCCTAAAACTAAAACCCTCATTCGCATCAGAGTGCGTTATTACTTGGGAGGCAATTAA 

HPC101 

ATGAAAACAAACGGGCTTTTTAAAATGTGGGGGCrGTTTTTAGTTTTAATCGCT 

AT AAAG AAAAAAAGG ACG CTTTAG AAG TC ATT AAACAAAG AGGGG TTTT AAAAGTGGGGGTTTTT AG CG AT AAG CC T CCTTT 

TGGATCTGTGGATTCTAAAGGGAAATATCAAG^CTATGATGTGATCATCGCTAA^ 

GAAAATAAGATTCAGTTTATTCCCGTAGAAGCTTCJtGCTAGGGTGGAAT^ 

CTAATTTCACGCGCACTAAAGAAAGAGAAAAAGTCGTGGATTTCGCTAATCCGTATATGAAAGTCGCTTKGGGGGTGATTTC 

TAAAGATGGGGTCATTAAAAATATAGAAGAGTTGAAGGATAAAGAGTTCATTGTGAATAAAGGCACGACAGCGG 

TT CACT AAAAATTAC C C CAAT AT CAAACTTTTG AAATTTG T ACAAAACACAGAGACTTTTTT AG C CCTTTT AAAT AAT AAGG 

CCACCGCTCTAGCCCATGACAACACTTTATTGCTCGCIT^ 

TGGCG AT AAAG ATGTG AT CG CTCCAG CG ATT AAAAAAGG CAACCCT AAG CTTTT AG AATGGTTGAAT AACG AGATTG ATTCC 
CT CATTTCT AG CG ACTTTTT AAAAG AAG CTT ATCAAG AAACTTT AG AG C CTGTTT ATG GCG ATGAAAT CAAACC 

HPC107 

ATGAAAAACACCAATACAAAAGAGATAAAGAATACAAGAATGGAA^ 
TTTTAAAAACCGCTTTTGCTTTTTAGCCTTCCTTTAAGCATGG 
TCAAATCGGCGGTGCGCAACAAAATATCAATAACAAAGGCAGCACCCTA^ 
GGC GTGG GTATGGCAGGGGGTAATGGGCTTTTAGCCTTAGCGACAAAm 

AAATTTT CAAT ACT AAT ACAACTG TTGG CAACAAC AACGCAG AATT AAC C CAG TTT AAAAAAATACTCCC C CAAATTG AG C A 

ACGCTTTG AAGCG AAT AAAAACG CIT AT AGCGTT CAAG CCTTG CAAGTGT ATTTGAGT AATG TG CTTT ATAACTTGGTT AAT 

AATAGTAATAATGGCAGCAATAATGGAGTCGTTCCTGAATATGTAGGGATTATAAAAGTTCTCTATGGT^ 

TCAGTCTCTTAGCCACGGAGAGTGTGGCGCTTCTAAACGCGCTTACAAGGGTGAATCTGGA 

AGGGCWATTAGCCCAAATGCAGCTTTTTAATCACACTTCTGCAGCAAAGCT 

GGTGGTGCAGGGGCCATGCTTCAAAAGGATGTGAAAACCATCTCGGATCGAATCGCT 

TAGGAGGGATCCTAAAGAATTACGATGAGCCATACCTACCCCAATrTGGG 

TGGCTTTGGCATTCAAATGGGCrATAAGCAATlTri"lG 

TACGGCTTTACGCAATTGGGCAGTCTTAGCAGCGCTGTTAAAGCG^ 

GGAATATCTTTAGAAGGGTTTTTAGCGATCAGTCCTTGAATG 

GGATAGCTCTTTAAGAGGTCAAATTCAGAATTCGTTTAAAGAATACCCCAOT 

GGCTITAAGGGCTCATTTTGCCAGCACCATGCACCGCCG 

HPC110 

TTTACAAAGATTATGAAGAGAGCTAGAGGGCTTGTGAAAAA^ 

ATGTTGCGTGCAAGAAAGCGAAAGAATTGGACGATAAAGTCCAGGATAAATCCAAACAAGCTGAAAAA 

TTGGTGGAAATATTCAGGATTAACAATAGCGACAAGTTTATTATTAGCCGCTTTGTA 

GAGTTAGAA(TAAGAAAAACAAAAGAGAGAACAAGAACAACAGAAAAC^GA 

HPC117 

ATGCCATACGCCTTAAGAAAAAGATTTTTCAAACGCCTTGCGC^ 

AAAGCTATCTGTTTTCCCCCITX3CCCCCAGCGCACCAACAAATCATTAA 

CTTGATGTTGCAAAATCAAATCTTTTCTTTTGTTT 

CATG ACAT ACTCAATAAACT CAAC C CTGGATTCATCGCTT CTCAAACTCCAGCT AAAG ACAG CT ATGAG CCTAAG ATTGAAT 
TAGCGGTTTTACTGCCTAAAAAGGTGGTGGGGCGTTATGCC^ 

AAACAACG ATTTCAATATC CAAGT CTTTG ACAG CGATGAAGAGAGTCCTGAAAAATT AG AG CAAAC CTATAAAGAAATTGAA 
AAAGAAAAATT CCCTTTTGTG AT AG CCTTATT AAC CAAAG AGGGCGTGGAAAATTTGCTCCAAAACACCACGATT AG CACC C 
CTACTTATGTGCCTACGGTGAATAGAACGCAATTAGAAAATCAAACTC 
GATTGACTATAAAGAGCAATTAAGCATGCTCACGGCTTTCATTAGCCCTAAT^ 

CTAATAGGAGAACG CTTG AGGCAAAT CACGG AGTCTTT AAG CATTGAAGTCAAACACCAAGAAAATATTT CTTACAAACAAG 

CGACCAGTTTTTCTAAAAATTTTAGAAAAAACGATGCXJTTTTT^ 

AAGCGGCCTTATCCTTTCTCAAATAGGGCTTTTAGAATACAAG^ 

TCTTTACTCTT ACT CACCCAG CCT AAAG ACAGAAAGAATTT ATT CATCGTCAATG CCTTG CAAAATAG CGATGAAACGCTTA 
TAG AATACG CCTCCTT ATTGGAGAG CG ATTT AAGGCATG ATTGGG TGAATTATTC CAGTGCAATTGGGCTAGAGGTGTTTTT 
AAACACACTAGATCCGCATTTTAAAAAATCTTTTCAAGAAAGTT^ 
CAGGCTTTAGGGTATTCTTTT'GAGCCGATAAAAAATGAAAGCGGAA 

HPC129 

ATG TCAAAT AG GATGTTGGATAAAAAT AAAG CG ATTCTTT ACAGGGGGTGGGGCTTT ATT ATT AGGGCT AAT CGTG (TTTTTTT 

ATTTAGCTTATCGCCCTAAGGCTGAAGTGCTGCAAGGGTTTTTGGAA 

CCGCATTGAAAAGGTGTTTGTT AAAAAAGG CGATCGCATTAAAAAGGGCGAT^ 

GAAG CCAAACTCG CTCAAGCTGAAGCCGGG CATAAAG CCGCTAAAGCGCTT AG CGATGAAGTCAAAAGAGGCT CAAGAGACG 

AAACGATCAATTCTGCAAGAGATGTTT<^CAAGCGGCAAAATCCCAAGCGACTCT 

AG ATTTGTATGATAACGG CGTGG CG AG CTTG CAAAAG CGCGAT AAAGCCT ATG CAG CTTAT 

HPC132 

ATGAAAATTTTAAGTTTATGGTTAGGGGTGTTTTG 

ATAAGGAGAATTTCACGCATTTTG AATACG CT AAC CCT AACG CTAG AAAGGGCGGTGTTTTGAGGAATGACG C CAT AGGG AC 
TTTTGATAGCCTTAACCCTTGA 

HPC137 

ATGAAAACITATTTATATAACCA1"1'1"1"1"1ATTTTTCTGCTT^ 
ATGCTTTGAGTGTTATCACCACTAAAGAAATTAACGCTAATTTGCCTAAT 
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GAGGGTGTTTAAAGTAGAAGCTCATGGGTTTTATTTTAGAAACAACGCAA 

TT AAG AG ACAATCAAT CGTTTC CTTTG A CT AG C C CTG CT AAAACCAG TTT AAAAAT AC CTTCTAACG C CAAG ATT AAAAAAT 

CCACTCTCCTTGTTTTAAAGGGCGAGAATGCTGAAGAAGTGGCTAAGATTTTAGGCATT 

AGAAAAC^CCGCTCAAACCAACGCTACCAATGACCCTATGTATGC 

TACGATAACAATCCTAATAGCCCTAACAATAACGCTATCAATGGTAAAGATGGCGCAAATGGGAGTAATGGCTATG^ 

ATG G CAA CG A TGGG AT AAATGGG AG CAG TGGG AG T AATGG AAATAATT CAAAT AAT AATG C CG TGGG CAG TGGT ATTG AT AC 

AG ATGG CGTGTTGGGTGTGGATGG AGTG AATGG ATCTAACTCTTCAAG CGGTGGCTCTGTAGGGGGTTATG AGAATAATTTC 

ACTAATCATGGCTCTACTAGCAATAACACAGGAGGGTATGACAATTTTAA 

ATGGGGGGCTTTTCCCTATTCCTTTTCGTAATGGTGGCACAAACAATTCCAATAA 

TGX3CAGTAGTTCCAATAGCGCCACTAATCCTAACTCGCAAG AAAACAATT ACTCCAGCCAGTATT^TAAAG CG CCCAARTTA 

AGCCCTAACAACACGATGAAACTAGATGTTATCGCTAAAGATOGCTCTTGTAra 

AATGTGCTTATAGATACGATTTTGAAGCCG 

HPC14 9 

TTGTCT AAAGG TTTGAG T ATCGGTAATAAAATCAT ATTGTGGGTGG CGTTGATTGTG ATCTG TGTC CG TG AG CATTTTAG G GG 

TGTCCTTGAACAG CAGGGTG AAAG AG ATTTTAAAAG AAAGCG CTCTGCATTCTATG CAAGATAGTTTG CATTTCAAGGTTAA 

GGAAGTGCAAGTCGTTCTTGAAAACACTTATACGAGCATGGX3CATTGTCAAAGAAATGCT 

ATCAAAATCCGCTT GTTCA AAAACTTCATTTTAGCCAATTC^ 

ATTTAGGATTAACGCTTTTAAGGGATAACGATACGATTAAAGTGATC 

AAAAGC GATCA AA AATA AAGAAATTTCTAAAAGCTTCCCTTATTATAGGAAAA 

GATATTCxiiiACCrrrrATTGAATGAGAACGCTCAAGAGGTTGTAGG 

G CAATGAAATCACTAAAAACAGGAG CGATTTGTTTTTAATTGG TGTT AAGGG TAAAGTG CTTTTG AG CG CG AATAAG AGTTT 

GCAAGACAAATCTATCGCAGAAATTTATAAGAGCGTGCCrAAAGCCACCAACGAAGTGCTG 

AAAGCGACTTTAGAATATTTGGATCCCTTTAGCCATAAGGAAAA 

CAGAAAGTAAAGACAVTT 

TTTTG TGGTGAT CAT AGCGAGCG CG ATCATGG TG TTAG C CTTG ATTAT AG CGATCACTCTTTTAATG CGAGCG ATTGTG AG C 
AATCGTTT<K3 AAG CCGTTTCT AG CACCTTGTCT CATTTCTTTA CAAG CC CATTCT AGCG ATATT AAAT 

TGATTGAAGCAAAATCCAATGACGAATTAGGGCGCATGCAAAGA^ 

GCAAGAAGACAGGCAAGCCGTCCAAGACACCATTAAAGTGGTTTCAGACGTGAAAGCAG^ CGGTG CG CATCACA 

G CTGAT CCCG CAAG CCCTG ATTTG AAAGAATTGAGGG ACG CG CTAAATGGGATCATGG ATT ATT^ CAAGAAAG CGTAGGG A 
CTCACATCCC^GCATTTTCAAAATCTTTGAAAGCTATTCT 

GG TGGAATTGG TTACT AACG CTTTAGGG CAAG AAATCCAAAAAATG CTAG AAACTT CGT CTAATTTTG CCAAAGATTT AG CG 
AACGATAGCGCGAATTTAAAAGAATGCGTGCAAAATTTAGAAAAGGCTTCAAACTCCC^ 

CT AAAACG ATAGAG AAT ATCA CCACTTC CATTCAAGG CGTGAG CTCT CAAAG TGAAG CCATG ATTG AACAAGGG CAAG A CAT 
TAAAAGCATTGTAGAAATCATTAGAGACATCGCTGATCAAACCAATCTATTAGCC 

HPC161 

GTGGCGXSTCAAAAAAATCGTIXSTGGGTTGGTGTGTGGCGTTGG C 
TCAGTAATGCGGATTTGATTAAAGAAATAAGGGACTTAAAAAAAATCATC^ 

AAGAG TG CAAG AAGTCTTG T CTGGG C1AATTAGGGGATATGCGTAAGG AT ATATTAAG CA CTAG AGATTATTG CATTAG CTT A 
AGGCCTTATATCTATAATTGGCGCTAG 

HPC169 

ATGGTATTTGACAGAACAATCAGCGTAAGAGAAAAAAAAGCGGCTAAAACGCT^ 

TGTTTGGCATCGTAATAAGCGGGGTGGCTTTTCAAAAAGAGTGGGTGCAACAATTGG 
CAACCCTGCCCCCATTCAA 

HPC172 

CGATATGATAAAGGGTTTGAAAAAGATAAAAAAGATCTAGA 

GTG CG ATTTTAGGGGATATTT ATCG T AATGG TGAAGG CGTAA CACAAAATTTTAAAAAAG CTTTCAAATATTACTCTAAAG C 
TTGCGAATTAAATAATGGTGAAGGGTGTTCCAAATTAGGAGGGGATTATTT^ 

AAAGCi 1 xiGG ATATTACTCTAAAG CTTGCGAATTAAACGAAGCTCT AACATGCACGCTTGTAGGAGAGTTTTATCGTGATQ 
GTGAAGGCGTAACAAAGGATCTTAAAAAAGCTTTTGAATATTCTGCT 
CGCTCTAGCAGCGTTTTATAATGAGGGTAAGGGCGTAGCAAAG^ 
AAGCTAGGATTAAAAGAAGCATG CGATATTCTCAAAGAACAAAAACAATAA 

HPC174 

ATGAAAAAATTTTTTTCTCAATCTTTATTAG CTTTG ATTG TGTCT ATG AACG CG CTACTG GC CATGGATGG CAATGGCG TTT 
TTTT AGGGG CGGGTT ATTTG CAAGGG CAAG C CCAAATG CATGCGG AT ATTAATTCT CAAAAACAAG C CACTAACG CT ACT AT 
CAAAGGCTTTG ATG CG CTTTTAGGGT ATCAATTTTTCTTTGGGAAAT ACTTT<^ CTT ATGGG TTTTTTG ACTA C 
G CTCATG C CAATT CTATT AGG CTT AAAAA CC CT AACTAT AACAG CG AAGTI^CG CAATTGG CGGGTCAAATTCTTGGG AAAC 
AAGAAATCAATCGCTTAACGAG CCTTGCTGAT CCTAAAACCTTTGAGCCAAACATGCTCACTTATGGGGGGGCTATGGATTT 
AATGGTTAATG TCAT CAATAAC GGTA TCATCAGTTTGGGGGCTTTTGGTGGGGTC 

G CGA CACCG AG CTTTG AAGG CATTTTAG TGG AG CAAG CTTTGGTG AG T AAAAAAGC CACTTCTTTC CAATTTTT ATTCAATG 
TGGGGGCT CG CTT AAGGATCTT AAAG CATTCCAGCATTG AAG CGGGC^ 
CACTGCAAAAAATTTGGATATAGGGTTTAGGCGCGTGTATTCG^ 

HPC176 

ATGTTAGGGAAAAAAAACX5AGGAAGTCTTCATTGATGAAAA 

TCAATAAGGCCAAT AGG ACTTTCAAAAGGG CTTTTTATCTCTCT ATGGTG CTCAATGTTG CCGCTG T AACG AGT ATTG TG AT 
GATGATG CCTTTGAAGAAAACGGATATATTTGTTT ATGG CATTG ATCG ATAC^ 

G ATG CT AGACAAATTGTCAATTCTGAAG CTGTTG TGG AT AGTGCAACTTCAAAATTTG TCTCATTG CTGTT^ CA 
AAAATTCTTTGAGGGATCGCAAGGATCAATTAATGCAGTATTGCGATGTG^ 
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TG AAAAT AT CAG ACAATT CGT AG AT AAAGT C CG AG CAG AAG CT ATCATT AGCTCT AA CAT ACAAAG AG AAAAAG TCAAAAAT 
AGTCCCTTAAraAGATTAGCATTTTT<^TTACCATCAAAATCACACCG 

HPC180 

ATGAAAACCTOTAAAAACCTCCTCTGTTTTAGCCTGATCGCTAT^ 

GGGCCATTAACAGCTACACCACTAAAAAGCTTAATGAAATCAAGGATCAAGT 

T A C C ACTT ATAACG CT AATGG CATG CTCATT AACATTG ATTGTAAAGTCTTAAAAAAT AACTT CT 

AG CG AG TT AAAAAAC C CT ATTT ATGG CG TG AG CGTGTTGTTTGGGG ATTT AG TGG AT AAAAAT AAT ATTG AAAAACG CT ATG 

AGTTTAAAACAGACACTCGATTAGCCAAATACCAACAAGCCACGACACAAG 

TTTTGTGGCGAATGACGCTTCTTTTGATTTTGraTCT 

GCCAAAAACACCAATAGGGATTCTGTTTTATTGGTAGAAAAAGAGGGCSGTAATT^ 

TAGAAGAACTCACCATC^TCAAACAGGGTTATAGGACTTTTAGCCCTAA 

CTATGATACAAGGCTAACGX3ACAGCTATGAAAACGCTAAAAGCGAATGCTTTTATATC 

TTACAAGAAATGAGAAAAGATTGTAAAGGATATGAGCGCGTTGAAAAGCATC 

TG AACGAATTGCCTAAGTATTTTAACAACG CTAAGAAGTATTAA 

HPCX87 

TTGT ATTTTTT ATTGG CT CTTTTTTACG ACTC CI^ A CATTGTAGGCGAT ATTTTG CAATTGAAATTTAT CCGT CAAAAG CT C 
TG CG AGAAGCCCGTTTTA CTC CCACAAAAGG ATT ATG AAG AAGCGGGAAATT ATG C CATTAGG AAAATG CAATT AT C CATT A 
TTTCTCAAATTTTAGACGGGATAATCTTTGCTGGTTGGGTCTTTTTTGGTTTC 
AAACCTTCCTGAAACGCTAGGTTACTTGGTGTTTGCCTTC 
TACTACACCACCATGCATTTGGATAAGGAATTTGGCTTTTCTAAGGTGAGT^ 

GGTT ATCG CT CACTTT AAG CGTGGGGTTGTTGTTG ATTT ACACT CTT ATT ATG ATCATTG AACATGTGG AGCATTGGGAG AT 
TAGCTCATTTTTTGTCGTGTTTGTTTT^ 

ACCCCCTTG-AATAATAGGGATTTGGAGAGTCAAATTGAGAGCATGATGGATAAG^ 

TGATGGACGCTAGCAAGAGGGATGGGCGTTTGAATGCGTATTTTGG^ 

CACTTTGATTTCTAAAGTTGGGACAGAAGGGCrTTTAGCCATTTTAG 

T TGAA AAGTTTAGGGATTATGGGAGGCTTGCTCGCTCTTGTT^ 

GCTTTAATGTCTCACAAACGCCAGCXSAGTTTGA 

TTTGATCGGGTTTTTTAGCCGAAAGAATGAATACAATGCGGAC^ 

AAAGCG 

HPC189 

TTGGAATCCTATGGGTTGGCTTGCTCTGACCGCAGGAT^ 

TTAGTTCAAGATATOUUVGATCCCAACAAAAAAAAGAAGTGG^ 

TGTGAAAAGCCGACTTGAAAGTCGCAAAAAAGACATATGGGAAAAGATTC 

AATTACGAACXJCATGAAAGGACAATTGAAAGAAGCCCATGAAAAATTAGGATACA^ 

CAAAACAAGGAGCATGCAATGAAGAATGA 

HPC191 

GATCAAAAAACGGCTCAAAAAATGCTCGCTGATTTGAGCGTGGTAGGGGCGT^ 

CTCAAAG CCCTTATTACAGAAG CAACAACT ATT ACAACT CATGTATGG 
CATGG GCAT GTATGATlTTTATCACrTTTATG 

GATT ACTTGATGTT AGAAAATT ACATG T ATG C^CTCG ATCAAGAAGAGATTTT AG AC CATGACGCTTCT AAT AATCAACTTG 

ATACGCCTACI^TGATGACAGAGACGATAAGGACGATAAATCCTTGCAG 

CAAATTGAGCAAAGGCATTCAAACCAACCGCTTGAATAGC^ 

TCGCTTTTCCACACTAAAGCCATGCCTACTAAAAGaSTGGA 

GGCAAATCAAAGAAATGAAGCAAGATGGGGCGAGTCCTAGTAAGATTGATTC^^ 

CAAATTAGACAATAATCTCAACCAATTAGACAATGACTTAAA 

GATAAAGCCCTAGACAGCGTGCAACAATTAAGCCATAGCAGCGATGTGGTGGG 

ATGGCGATGATAGAGACGATTTGAATGATGCGATCAAT^ 

GGACAACACCCATGCAAATtlAGAGCAAAGATC^VAGGGAGTAACG 

ACTCACACCGA(TGATACTCACACCGACACTAACACC^ 

CT AG CGG CAACAAT ACCGG CG ATATGAAT AACACGG ACACCGG CAAT ACHXSATAACGGTAACACIV^TCATATAAGCAACAT 
GAACAACGG CAACGATGATG CGGGTAACG CTAATGACX3 ACATG^^TAATAGCAACG ACATGGGCGATGACATGAATAATG CG 
AACGACATGAACGATGACATG 
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HPN16 5 

ATG AAA CAA TTT AAA AAG AAA CCA AAA AAG ATA AAA CGA TCG CAT CAA AAT CAA AAA ACA ATC TTA 
Met Lys Gin Phe Lys Lya Lys Pro Lys Lys lie Lya Arg Ser His Gin Asn Gin Lys Thr He Leu 

AAG CGT CCT TTA TGG CTT ATG CCT TTA CTG ATT GGC GGG TTT GCT AGT GGG GTG TAT GCG GAT GGA 
Lys Arg Pro Leu Trp Leu Met Pro Leu Leu He Gly Gly Phe Ala Ser Gly val Tyr Ala Asp Gly 

ACA GAC ATT TTG GGG CTT AGT TGG GGG GAA AAA AGC CAA AAG GTA TGC GTG CAT CGT CCA TGG TAT 
Thr Asp He Leu Gly Leu Ser Trp Gly Glu Lys Ser Gin Lys Val Cys Val His Arg Pro Trp Tyr 

GCT ATA TGG AGT TGC GAT AAA TGG GAG GAA AAA ACA CAA CAA TTT ACA GGA AAC CAA CTC ATC ACA 
Ala He Trp Ser Cys Asp Lys Trp Glu Glu Lys Thr Gin Gin Phe Thr Gly Asn Gin Leu He Thr 

AAA ACT TGG GGA GGG GGT AAT GCG GCT AAC TAC TAC CAC TCT CAA AAC AAC CAA GAC ATC ACA GCC 
Lys Thr Trp Ala Gly Gly Asn Ala Ala Asn Tyr Tyr His Ser Gin Asn Asn Gin Asp He Thr Ala 

AAT TTA AAA AAT GAT AAC GGC ACT TAT TTT TTA AGC GGT CTG TAT AAC TAC ACC GGA GGG GAA TAT 
Asn Leu Lys Asn Asp Asn Gly Thr Tyr Phe Leu Ser Gly Leu Tyr Asn Tyr Thr Gly Gly Glu Tyr 

AAT GGG GGG AAT TTA GAC ATT GAA TTA GGC AGT AAC GCT ACT TTT AAT CTA GGT GCG AGT AGT GGG 
Asn Gly Gly Asn Leu Asp He Glu Leu Gly Ser Asn Ala Thr Phe Asn Leu Gly Ala Ser Ser Gly 

AAT AGC TTC ACT TCT TGG TAT CCT AAT GGG CAT ACT GAT GTT ACT TTT AGC GCT GGG ACT ATC AAT 
Asn Ser Phe Thr Ser Trp Tyr Pro Asn Gly His Thr Asp Val Thr Phe Ser Ala Gly Thr He Asn 

GTG AAT AAC AGC GTA GAA GTG GGC AAT CGT GTG GGA TCG GGA GCT GGC ACG CAC ACC GGC ACA GCC 
Val Asn Asn Ser Val Glu Val Gly Asn Arg Val Gly Ser Gly Ala Gly Thr His Thr Gly Thr Ala 

ACT TTA AAC TTG AAC GCT AAT AAG GTT ACT ATC AAT TCC AAT ATC AGC GCG TAT AAA ACT TCG CAA 
Thr Leu Asn Leu Asn Ala Asn Lys Val Thr He Asn Ser Asn He Ser Ala Tyr Lys Thr Ser Gin 

GTG AAT GTA GGC AAT GCT AAC AGC GTT ATT ACC ATT AAT TCG GTT TCT TTA AAT GGG GAT ACT TGC 
Val Asn Val Gly Asn Ala Asn Ser Val He Thr He Asn Ser Val Ser Leu Asn Gly Asp Thr Cys 

AGT TCT TTA GCT AGG GTG GGC GTA GGG GCT AAT TGC TCC ACT TCT GGG CCT AGC TAT TCT TTT AAA 
Ser Ser Leu Ala Arg Val Gly Val Gly Ala Asn Cys Ser Thr Ser Gly Pro Ser Tyr Ser Phe Lys 

GGG ACG ACT AAC GCT ACT AAC ACG ACT TTT AGC AAT TCA AGC GGC AGT TTC ACT TTT GAA GAG AAC 
Gly Thr Thr Asn Ala Thr Asn Thr Thr Phe Ser Asn Ser Ser Gly Ser Phe Thr Phe Glu Glu Asn 

GCC ACT TTT AGC GGG GCG AAA TTA AAT GGG GGG GCA TTC ACT TTC AAT AAA AAG TTT AAC GCT ACC 
Ala Thr Phe Ser Gly Ala Lys Leu Asn Gly Gly Ala Phe Thr Phe Asn Lys Lys Phe Asn Ala Thr 

AAT AAT ACC GCT TTT AAT AGC GGT AGT TTT ACT TTT AAA GGC ACA AGC TCT TTT AAT GGT GCG AAT 
Asn Asn Thr Ala Phe Asn Ser Gly Ser Phe Thr Phe Lys Gly Thr Ser Ser Phe Asn Gly Ala Asn 

TTT AGT AAC GCT TCC TAT ACT TTT AAT AAT CAA GCC ACT TTC CAA AAC AGC TCC TTT AAT GGG GGG 
Phe Ser Asn Ala Ser Tyr Thr Phe Asn Asn Gin Ala Thr Phe Gin Asn Ser Ser Phe Asn Gly Gly 

ACT TTT ACT TTT AAT GAC GAG ACC AAT CAA AGC ACC CAG CAC CCC CAA ATT CAA AAC AGC TCT TTT 
Thr Phe Thr Phe Asn Asp Gin Thr Asn Gin Ser Thr Gin His Pro Gin He Gin Asn Ser Ser Phe 

AGC GGC AGT GCT ACC ACT CTT AAG GGT TTT GCG ACT TTT GAG CAA GCC TTT AAC AAT TCA AAC CAC 
Ser Gly Ser Ala Thr Thr Leu Lys Gly Phe Ala Thr Phe Glu Gin Ala Phe Asn Asn Ser Asn His 

CAA CTA ACG ATA CAA AAC GCT TCC TTT AAT AAC GCT ACT TTC AAC AAT ACC GGT AAA ATC ACT ATA 
Gin Leu Thr He Gin Asn Ala Ser Phe Asn Asn Ala Thr Phe Asn Asn Thr Gly Lys He Thr He 

GAA AAA GAT GCG AGC TTT AAT AAC ACT TCG TTC AAC ACT CCT GTT GAT ACA AAC AAC ATG ACT ATT 
Glu Lys Asp Ala Ser Phe Asn Asn Thr Ser Phe Asn Thr Pro Val Asp Thr Asn Asn Met Thr He 

AGT GGT GGC GTT ACT TTA AGC GGT AAA AAT GAC TTG AAA AAT GGT GCA ACC CTT GAT TTT GGG AGT 
Ser Gly Gly Val Thr Leu Ser Gly Lys Asn Asp Leu Lys Asn Gly Ala Thr Leu Asp Phe Gly Ser 

TCT AAA ATC ACT CTC ACT CAA GGG ACG ACT TTC AAC CTC ACA AGT TTA GGC AGT GAG AAG AGC GTA 
Ser Lys He Thr Leu Thr Gin Gly Thr Thr Phe Asn Leu Thr Ser Leu Gly Ser Glu Lys Ser Val 

ACG ATT TTA AAT TCT AGA GGT GGG ATC ACT TAC AAT CAT CTT TTA AAC CAT GCG ATC AAT AGC TTG 
Thr He Leu Asn Ser Arg Gly Gly He Thr Tyr Asn His Leu Leu A3n His Ala He Asn Ser Leu 

ACA AAC GCC CTA AAA ACG AAC GAA AGC TCT TCA AAA CCG CAA AGT TTC GCT CAA GGT TTG TGG GAT 
Thr Asn Ala Leu Lys Thr Asn Glu Ser Ser Ser Lys Pro Gin Ser Phe Ala Gin Gly Leu Trp Asp 

ATG ATC ACT TAC AAT GGG GTT ACC GGG CAG CTT TTG AAT GAA AAC GCT GCA ACA TCT AAA CCC ACT 
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Met lie Thr Tyr Asn Gly Val Thr Gly Gin 

GAC TCT TCG CCC TCT AAA TCC TCT ACA AAC 
Asp Ser Ser Pro Ser Lys Ser Ser Thr Asn 

GAT ACT ATC TAC AAA CTG CAA GAA ACT TTC 
Asp Thr lie Tyr Lys Leu Gin Glu Thr Phe 

GGG ACT TAC ACG CCA CCC CCT GTC ATT AAC 
Gly Thr Tyr Thr Pro Pro Pro Val lie Asn 

AAT GCT GAC ATG CCT TGG TAT AAC CAT AAA 
Asn Ala Asp Met Pro Trp Tyr Asn His Lys 

GGG ACT TAT TAC TTG CCG AGC GTT CAA ATA 
Gly Thr Tyr Tyr Leu Pro Ser Val Gin lie 

AGC GCA AGT AAT AGC AAT CTG GTG ATT GGG 
Ser Ala Ser Asn Ser Asn Leu Val lie Gly 

AGC GAC ACG GTG GCT TTT GGG GAC ACT TCA 
Ser Asp Thr Val Ala Phe Gly Asp Thr Ser 

TAT TAC CAA TGC ACA GGC ACG ACT AAC GGC 
Tyr Tyr Gin Cys Thr Gly Thr Thr Asn Gly 

CTG CGT TCT GGC AAT CGT ATA GGC ACC GGT 
Leu Arg Ser Gly Asn Arg lie Gly Thr Gly 

ATC AAT ATC GCT AAC GCT ACC ATC ACG CAA 
He Asn lie Ala Asn Ala Thr He Thr Gin 

TCC ACG CAA AAC ATG GAC AAT TCG CAG AAT 
Ser Thr Gin Asn Met Asp Asn Ser Gin Asn 

TAT GGC ACA ACT TTC ACT AAC CAA GCC AAA 
Tyr Gly Thr Thr Phe Thr Asn Gin Ala Lys 

TTT GAA AAC ACC AAC TTT AAT GGA GGG AGT 
Phe Glu Asn Thr Asn Phe Asn Gly Gly Ser 

AAC AAC CAG TTC AAT AGC GGT TCG TTT GAG 
Asn Asn Gin Phe Asn Ser Gly Ser Phe Glu 

TTT AAC AAC AGC ACT TCT TTT AAT TTC AAT 
Phe Asn Asn Ser Thr Ser Phe Asn Phe Asn 

ACT AAC GCT AAT TCA AAT TTG CAA ATC GCT 
Thr Asn Ala Asn Ser Asn Leu Gin He Ala 

CAA AAT ACC GCT AAT TTT AAT AAT ACC GGC 
Gin Asn Thr Ala Asn Phe Asn Asn Thr Gly 

GTG GTA TTT AAC AGC CCT ACG' AAC ACG AGC 
Val Val Phe Asn Ser Pro Thr Asn Thr Ser 

AAA AAC TTG AAC GCT CCT TTG TCT TTT GGC 
Lys Asn Leu Asn Ala Pro Leu Ser Phe Gly 

AAT ATT GGT GAA GCT ATC ACA AAT GGC AAC 
Asn He Gly Glu Ala He Thr Asn Gly Asn 

TAC AAC GAC GCT TTC AGT AAA AAT CTA TGG 
Tyr Asn Asp Ala Phe Ser Lys Asn Leu Trp 

GAA AAG CTC GTT TCT AGT GCG GGT AAT GGC 
Glu Lys Leu Val Ser Ser Ala Gly Asn Gly 

TAC AAT TTC CAA GAG GTT TTT TCA CCC AAC 
Tyr Asn Phe Gin Glu Val Phe Ser Pro Asn 

TTT GAT TAT GTG GAT ATG GAA AAA TCG GAT 
Phe Asp Tyr Val Aap Met Glu Lys Ser Asp 
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Leu Leu Asn Glu Asn Ala Ala Thr Ser Lys Pro Thr 

TCT ACG CAA GTC TAT CAA GTG GGT TAC AAA ATA GGG 
Ser Thr Gin Val Tyr Gin Val Gly Tyr Lys He Gly 

AGC CAC AAT TCC ATT ATT ATT CAG GCT TTA GAG AGC 
Ser His Asn Ser He He He Gin Ala Leu Glu Ser 

GGC TCC AAA TTT GAC TTA TCC GCT TCA AAT TAT ATC 
Gly Ser Lys Phe Asp Leu Ser Ala Ser Asn Tyr He 

TAT TAT ATT CCT AAA TCC CAA AAT TTT ACA GAG AGC 
Tyr Tyr He Pro Lys Ser Gin Asn Phe Thr Glu Ser 

TGG GGG AGC TAC ACT AAC TCG TTT AAA CAA ACC TTT 
Trp Gly Ser Tyr Thr Asn Ser Phe Lys Gin Thr Phe 

TAT AAC GCA ACA TGG ACT GAT CAC AAT GTT TCT TCT 
Tyr Asn Ala Thr Trp Thr Asp His Asn Val Ser Ser 

GGG AGC GCT CTT AAT GGG CAT TGC GGG CCT TGG CCC 
Gly Ser Ala Leu Asn Gly His Cys Gly Pro Trp Pro 

ACT TAT AGC GCT TAT CAT GTC TAT ATC ACA GCG AAT 
Thr Tyr Ser Ala Tyr His Val Tyr He Thr Ala Asn 

GGG GCA GCC AAT CTA ATC TTT AAT GGG GTA GAT AGT 
Gly Ala Ala Asn Leu He Phe Asn Gly Val Asp Ser 

CAT AAC GCC GGG GCT TAT TCA AGC TCT ATG ACT TTT 
His Asn Ala Gly Ala Tyr Ser Ser Ser Met Thr Phe 

TTG AAT GGC CTA AAT TCT AAC GGC AAG CTT TTG GTG 
Leu Asn Gly Leu Asn Ser Asn Gly Lys Leu Leu Val 

GAC GGG AAA TTC ATT TTC AAT GCA GGG CAA GCG ACT 
Asp Gly Lys Phe He Phe Asn Ala Gly Gin Ala Thr 

TAC CAA TTC AGC GGC GAT AGC TTG AAT TTT TCA AAT 
Tyr Gin Phe Ser Gly Asp Ser Leu Asn Phe Ser Asn 

ATT GGC GCA AAA AAT ACT ATT TTT AAT AAC GCT AAT 
He Gly Ala Lys Asn Thr He Phe Asn Asn Ala Asn 

AAT TCT AGC GCG ACC ACT TCG TTT GTG GGG GAT TTC 
Asn Ser Ser Ala Thr Thr Ser Phe Val Gly Asp Phe 

GGG AAC GCT GTT TTT GGG AAC TCT ACT AAT GGC TCT 
Gly Asn Ala Val Phe Gly Asn Ser Thr Asn Gly Ser 

TCT GTT AAT ATT GCA GGG AAT GCA ACC TTT GAT AAC 
Ser Val Asn He Ala Gly Asn Ala Thr Phe Asp Asn 

GTG AAA GGG AAA GTT ACT CTC AAT AAC ATC ACT TTA 
Val Lys Gly Lys Val Thr Leu Asn Asn He Thr Leu 

GAT GGG ACG ATT GTT TTT AGC GCT CAT TCG GTG ATT 
Asp Gly Thr He Val Phe Ser Ala His Ser Val He 

CCT ATC ACC CTT GTA AGC TCT TCT AAA GCA ATT GAA 
Pro He Thr Leu Val Ser Ser Ser Lys Ala He Glu 

CAG CTC ATC AAC TAC CAA GGG CAT GGG GCT AGC AGT 
Gin Leu He Asn Tyr Gin Gly His Gly Ala Ser Ser 

GTC TAT GAT GTG GTG TAT TCT TTC AAC AAC CAA ACC 
Val Tyr Asp Val Val Tyr Ser Phe Asn Asn Gin Thr 

AGC ATT TCT ATC CGG CGT TTG GGC GTT GGC ATG GTG 
Ser He Ser He Arg Arg Leu Gly Val Gly Met Val 

CGT TTG TAT TAT CAA AAC GCT CTC GGT TTT ATG ACC 
Arg Leu Tyr Tyr Gin Asn Ala Leu Gly Phe Met Thr 
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TAC ATG CCT AAT AGC TAT AAC AAT AAT TTA GGG AAT TTA AAC AAC ACC ATT TAC TAT TAC GAC AAC 
Tyr Met Pro Aan Ser Tyr Asn Asn Asn Leu Gly Asn Leu Asn Asn Thr He Tyr Tyr Tyr Asp Asn 

AGC ATT GAC TTT TAT GCG AGC GGG AAA ACT CTA TTC ACT AAA GCG GAA TTT TCT CAA ACG TTC ACT 
Ser He Asp Phe Tyr Ala Ser Gly Lys Thr Leu Phe Thr Lys Ala Glu Phe Ser Gin Thr Phe Thr 

GGG CAA AAC AGC GCG ATC GTT TTT GGG GCT AAA AAT ATA TGG ACG AGC GTA AGC GAT GCG CCG CAA 
Gly Gin Asn Ser Ala He Val Phe Gly Ala Lys Asn He Trp Thr Ser Val Ser Asp Ala Pro Gin 

TCT AAT GTG ATC ATT CGC TTT GGG GAC AAT AAG GGA GCA GGG AGT AAT GAT GCG AGT GGG CAT TGC 
Ser Asn Val He lie Arg Phe Gly Asp Asn Lys Gly Ala Gly Ser Asn Asp Ala Ser Gly His Cys 

TGG AAT TTG CAA TGC ATA GGC TTT ATC ACA GGG CAT TAT GAA GCG CAA AAG ATT TAC ATC ACC GGC 
Trp Asn Leu Gin Cys He Gly Phe He Thr Gly His Tyr Glu Ala Gin Lys He Tyr He Thr Gly 

AGT ATT GAA AGC GGG AAC CGC ATT TCT AGC GGT GGG GGC GCG AGC CTT AAT TTT AAC GGG CTT CAA 
Ser He Glu Ser Gly Asn Arg He Ser Ser Gly Gly Gly Ala Ser Leu Asn Phe Asn Gly Leu Gin 

GGC ATT CTT TTA ACG AAC GCG ACT TTG TAT AAC CGC GCC GCT GGC ACG CAA AGC TCT TCT ATG AAT 
Gly He Leu Leu Thr Asn Ala Thr Leu Tyr Asn Arg Ala Ala Gly Thr Gin Ser Ser Ser Met Asn 

TTT GTT TCT AAC AGC GCG AAC ATT CAG GCT CAA AAC TCC TAT TTT ATA GAC GAT ACC GCA CAA AAT 
Phe Val Ser Asn Ser Ala Asn He Gin Ala Gin Asn Ser Tyr Phe He Asp Asp Thr Ala Gin Asn 

AAA GGC AAC CCT AAT TTT AGT TTC AAC GCT TTG AAT CTG GAT TTT TCT AAC AGC TCT TTT AGA GGC 
Lys Gly Asn Pro Asn Phe Ser Phe Asn Ala Leu Asn Leu Asp Phe Ser Asn Ser Ser Phe Arg Gly 

TAT GTG GGG CAA ACG CAG TCT GTT TTT AAA TTC AAT GCC GTT AAT GCG ATC AGT TTC ACT AAC AGC 
Tyr Val Gly Gin Thr Gin Ser Val Phe Lys Phe Asn Ala Val Asn Ala He Ser Phe Thr Asn Ser 

TCT AAT TTA AGC TCT GGT TTG TAT CAA ATG CAA GCT AAA AGC GTG TTG TTT GAC AAT TCC AAT TTA 
Ser Asn Leu Ser Ser Gly Leu Tyr Gin Met Gin Ala Lys Ser Val Leu Phe Asp Asn Ser Asn Leu 

AGC GTT TCA GTG GGG ACA AGC AGC ATT AAA GCC AAT GCG ATC AAT CTT TCT CAA AAC GCC TCT ATC 
Ser Val Ser Val Gly Thr Ser Ser He Lys Ala Asn Ala He Aan Leu Ser Gin Asn Ala Ser He 

AAT GCG AGC AAC CAT TCA ACC TTA GAA CTT CAA GGC GAT TTG AAT TTG AAC GAC ACC AGC TCG CTC 
Asn Ala Ser Asn His Ser Thr Leu Glu Leu Gin Gly Asp Leu Asn Leu Asn Asp Thr Ser Ser Leu 

AAC CTC AAC CAA AGC GCC ATT AAT GTT TCT AAC AAC GCC ACG ATC AAC GAT TAT GCG AGC TTG ATT 
Asn Leu Asn Gin Ser Ala He Asn Val Ser Asn Asn Ala Thr He Asn Asp Tyr Ala Ser Leu He 

GCG AGT AAT GGC TCT CAC CTT AAT TTT AAC GGG GCG GTT AAT TTC AAT TCA GCG AAT ATT ACT ACG 
Ala Ser Asn Gly Ser His Leu Asn Phe Asn Gly Ala Val Asn Phe Asn Ser Ala Asn He Thr Thr 

AGT TTG AGT AGT TCC TCT ATC GTG TTT AAG GGG GCG GTC TCT TTA CGA GGG CAG TTT AAT TTA AGC 
Ser Leu Ser Ser Ser Ser He Val Phe Lys Gly Ala Val Ser Leu Arg Gly Gin Phe Asn Leu Ser 

AAT AAT TCT TCT TTA GAT TTT CAA GGC TCT AGC GCT ATC ACC TCT AAC ACG GCG TTT AAT TTC TAT 
Asn Asn Ser Ser Leu Asp Phe Gin Gly Ser Ser Ala He Thr Ser Asn Thr Ala Phe Asn Phe Tyr 

GAT AAC GCT TTT TCT CAA AGC CCC ATC ACT TTC CAT CAA GCC CTT GAC ATT AAA GTG CCC TTG AGT 
Asp Asn Ala Phe Ser Gin Ser Pro He Thr Phe His Gin Ala Leu Asp He Lys Val Pro Leu Ser 

TTG GGA GGC AAC CTC TTA AAC CCT AAC AAC AGT AGC GTG CTG AAT TTA AAA AAC AGC CAG CTT GTT 
Leu Gly Gly Asn Leu Leu Asn Pro Asn Asn Ser Ser Val Leu Asn Leu Lys Asn Ser Gin Leu Val 

TTT AGC GAT CAA GGG AGC TTG AAT ATC GCT AAC ATT GAT TTA CTA AGC GAT CTG AAT GGT AAT AAA 
Phe Ser Asp Gin Gly Ser Leu Asn He Ala Asn He Asp Leu Leu Ser Asp Leu Asn Gly Asn Lys 

AAT CGT GTG TAT AAC ATC ATT CAA GCG GAC ATG AAT GGT AAT TGG TAT GAG CGT ATC AAC TTC TTT 
Asn Arg Val Tyr Asn He He Gin Ala Asp Met Asn Gly Asn Trp Tyr Glu Arg He Asn Phe Phe 

GGC ATG CGC ATT AAT GAT GGG ATT TAT GAC GCT AAA AAC CAA ACT TAT AGT TTC ACT AAC CCT CTC 
Gly Met Arg He Asn Asp Gly He Tyr Asp Ala Lys Asn Gin Thr Tyr Ser Phe Thr Asn Pro Leu 

AAT AAC GCC CTA AAA ATC ACC GAG AGC TTT AAA AAT AAC CAA CTG AGC GTT ACG CTC TCT CAA ATC 
Asn Asn Ala Leu Lys He Thr Glu Ser Phe Lys Asn Asn Gin Leu Ser Val Thr Leu Ser Gin He 

CCG GGC ATT AAA AAC ACG CTC TAT AAC ATT GGC TCT GAA ATC TTT AAC TAC CAA AAG GTT TAT AAC 
Pro Gly He Lys Asn Thr Leu Tyr Asn He Gly Ser Glu He Phe Asn Tyr Gin Lys Val Tyr Asn 

AAC GCT AAT GGC GTG TAT TCT TAT AGC GAT GAC GCA CAA GGC GTG TTT TAT CTC ACG AGC AGC GTG 
Asn Ala Asn Gly Val Tyr Ser Tyr Ser Asp Asp Ala Gin Gly Val Phe Tyr Leu Thr Ser Ser Val 
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AAA GGC TAT TAC AAC CCC AAC CAA TCC TAT CAA 
Lys Gly Tyr Tyr Asn Pro Asn Gin Ser Tyr Gin 

AAT CTA ACC TCT GAA TCT TCT GTC ATT TCG CAA 
Asn Leu Thr Ser Glu Ser Ser Val lie Ser Gin 

TTA CAC GTC TAT AAC AAG GGC TAT AAT TTC AGT 
Leu Hi 3 Val Tyr Asn Lys Gly Tyr Asn Phe Ser 

CTC TAC CCT GAA ATC AAA AAG ATA TTA GGG AAT 
Leu Tyr Pro Glu He Lys Lys He Leu Gly Asn 

GGC GAT GCG CTA AAC CAG CTT ACC AAG CTC ATC 
Gly Asp Ala Leu Asn Gin Leu Thr Lys Leu He 

ATT GAT AAC GCA AAC AAT TCG GTC GTG CAA AAT 
He Asp Asn Ala Asn Asn Ser Val Val Gin Asn 

AAA ATA GGG CAA ACA GAC ACC AAT AGT GCG GTG 
Lys He Gly Gin Thr Asp Thr Asn Ser Ala Val 

GAT TAC ACT GAT ATT GTG TGC CAA AAA TTT AGA 
Asp Tyr Thr Asp He Val Cys Gin Lys Phe Arg 

TCG GCT GAT TTG GGC TAT ATT GAC ACG ACT TTT 
Ser Ala Asp Leu Gly Tyr He Asp Thr Thr Phe 

GGG AGC GGG AAC GCA TGG GGG ACT GGG GGG AGT 
Gly Ser Gly Asn Ala Trp Gly Thr Gly Gly Ser 

ATT CTC AAC CAA GCG AAT ATC GTA AGC TCG CAA 
He Leu Asn Gin Ala Asn lie Val Ser Ser Gin 

GGC ATC AAT AAG GTT TTC AAT CAA GCC GGG CTC 
Gly He Asn Lys Val Phe Asn Gin Ala Gly Leu 

ATT AAC AAA GCC GGG GGA TTA GGG AAT TTG ATA 
He Asn Lys Ala Gly Gly Leu Gly Asn Leu He 

GGG TAT TTA ACG CCT GAG CAA AAA AAT CAA ACC 
Gly Tyr Leu Thr Pro Glu Gin Lys Asn Gin Thr 

AAC CTC ATG AAC GAT AGC GGT TTG AAC ACG GCG 
Asn Leu Met Asn Asp Ser Gly Leu Asn Thr Ala 

TGG ACC GGG CTA GTG GGG GGA TTA GCC GGA CTG 
Trp Thr Gly Leu Val Gly Gly Leu Ala Gly Leu 

ATA GGC AGC ATG TCC ATC AAT GAT TTA TTG AGT 
He Gly Ser Met Ser He Asn Asp Leu Leu Ser 

ATT TCC GCT AAC GAT ATA GGG CAA GTC ATA AGC 
He Ser Ala Asn Asp He Gly Gin Val He Ser 

GCT TTA AAA AAC GAT GTA GCC GCT TTG GGC AAG 
Ala Leu Lys Asn Asp Val Ala Ala Leu Gly Lys 

CTC AAT TCT TTA GAA AGC TTG CTG CAA AAC CAG 
Leu Asn Ser Leu Glu Ser Leu Leu Gin Asn Gin 

GCT AAA GGA TTA GGG TCT ATT TAT GAA CAA GGT 
Ala Lys Gly Leu Gly Ser He Tyr Glu Gin Gly 

GGG ATT TTC GCT CCC TAT GGC TTG AGT CAA GTG 
Gly He Phe Ala Pro Tyr Gly Leu Ser Gin Val 

GGC AAT GTT TTT GTG CAA AAT TCC ACT TTC TCT 
Gly Asn Val Phe Val Gin Asn Ser Thr Phe Ser 

GGA AAT TCG CTC ATT TTT GCC GGA AAC AAC CAC 
Gly Asn Ser Leu He Phe Ala Gly Asn Asn His 

TTG TTG TCT AAT CAA GTT TCT AAC ATT AAC GTC 



GCC AGC GGC AGC AAT AAC ACC ACG AAA AAT AAC 
Ala Ser Gly Ser Asn Asn Thr Thr Lys Asn Asn 

ACC TAT AAC GCG CAA GGC AAC CCT ATC AGC GCG 
Thr Tyr Asn Ala Gin Gly Asn Pro lie Ser Ala 

AAT ATC AAA GCG TTA GGG CAA ATG GCG CTC AAA 
Asn He Lys Ala Leu Gly Gin Met Ala Leu Lys 

GAT TTT TCG CTT TCA AGT TTG AGC AAT TTA AAA 
Asp Phe Ser Leu Ser Ser Leu Ser Asn Leu Lys 

ACG CCT AGC GAT TGG AAA AAC ATT AAC GAG TTG 
Thr Pro Ser Asp Trp Lys Asn He Asn Glu Leu 

TTC AAT AAC GGC ACT TTG ATT ATA GGA GCG ACT 
Phe Asn Asn Gly Thr Leu He lie Gly Ala Thr 

GTT TTT GGG GGC TTG GGC TAT CAA AAG CCT TGC 
Val Phe Gly Gly Leu Gly Tyr Gin Lys Pro Cys 

GGC ACT TAT TTG GGG CAG CTT TTG GAG TCC ATC 
Gly Thr Tyr Leu Gly Gin Leu Leu Glu Ser He 

AAC GCT AAA GAA ATT TAT CTT ACC GGC ACT TTA 
Asn Ala Lys Glu He Tyr Leu Thr Gly Thr Leu 

GCG AGC GTA ACT TTT AAC AGC CAA ACT TCG CTC 
Ala Ser Val Thr Phe Asn Ser Gin Thr Ser Leu 

ACC GAT GGG ATT TTT AGC ATG CTG GGT CAA GAG 
Thr Asp Gly He Phe Ser Met Leu Gly Gin Glu 

GCT AAT ATT TTG GGC GAA GTG GCA ATG CAA TCC 
Ala Asn He Leu Gly Glu Val Ala Met Gin Ser 

GTA AAT ACG CTA GGG AGT GAT AGC GTG ATT GGG 
Val Asn Thr Leu Gly Ser Asp Ser Val lie Gly 

CTA AGC CAG CTT TTG GGG CAG AAT AAT TTT GAT 
Leu Ser Gin Leu Leu Gly Gin Asn Asn Phe Asp 

ATT AAG GAT TTG ATC AGA CAA AAA TTA GGC TTT 
He Lys Asp Leu He Arg Gin Lys Leu Gly Phe 

GGG GGC ATT GAT TTG CAA AAC CCT GAA AAG CTT 
Gly Gly He Asp Leu Gin Asn Pro Glu Lys Leu 

AAA AAG GGG TTG TTC AAT CAG ATC ACC GGC TTT 
Lys Lys Gly Leu Phe Asn Gin He Thr Gly Phe 

GTG ATG CTG CAA GAT ATT GTC AAG CCG AGC GAC 
Val Met Leu Gin Asp He Val Lys Pro Ser Asp 

CAA ATG ATT GGC GAA TTT TTA GGC CAA GAC ACG 
Gin Met He Gly Glu Phe Leu Gly Gin Asp Thr 

CAG ATT AAA AGC GTT TTA GAC AAA GTC TTA GCG 
Gin He Lys Ser Val Leu Asp Lys Val Leu Ala 

TTG GGG GAT TTG ATC CCT AAT CTT GGT AAA AAG 
Leu Gly Asp Leu He Pro Asn Leu Gly Lys Lys 

TGG CAA AAA GGG GAT TTT AGT TTC AAC GCG CAA 
Trp Gin Lys Gly Asp Phe Ser Phe Asn Ala Gin 

AAC GCT AAT GGA GGC ACG CTC AGT TTT AAC GCA 
Asn Ala Asn Gly Gly Thr Leu Ser Phe Asn Ala 

ATC GCT TTC ACT AAC CAT TCT GGA ACG CTC AAT 
He Ala Phe Thr Asn His Ser Gly Thr Leu Asn 

ACC ATG CTT AAC GCT AGC AAC GGC CTT AAG ATT 
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Leu Leu Ser Asn Gin Val Ser Asn lie Asn 

AAC GCC ACT AAT AAC AAT GTT TCC GTG TCT 
Asn Ala Thr Asn Asn Asn Val Ser Val Ser 

CAA AGC GAT CCA ACG ACA GCT AGC GCC ACA 
Gin Ser Asp Pro Thr Thr Ala Ser Ala Thr 

AGT AAT GCG TCA AAC AAC GCG CCA ATC GCC 
Ser Asn Ala Ser Asn Asn Ala Pro He Ala 

AAT GGT TTC AAT TTT TCA GGC AAT ATT TAC 
Asn Gly Phe Asn Phe Ser Gly Asn He Tyr 

TCT GCA AAC GTT AAA AAC CTG TAT CTT TAC 
Ser Ala Asn Val Lys Asn Leu Tyr Leu Tyr 

TCC AAC CAA GCG GTA TTA GAG AAA AAC GCT 
Ser Asn Gin Ala Val Leu Glu Lys Asn Ala 

TTT AAC AAC AAC GCC ACG CAA AAA ATA GAG 
Phe Asn Asn Asn Ala Thr Gin Lys He Glu 

TTA AGC ACC GGG ATT TAT GGG TTA GAA GTA 
Leu Ser Thr Gly lie Tyr Gly Leu Glu Val 

AAT TTA GAA AAT TCT CAA ACG CCT GTA AAT 
Asn Leu Glu Asn Ser Gin Thr Pro Val Asn 

ACC ACC CAA ACG CCT TTT ATG AAT GTC AGC 
Thr Thr Gin Thr Pro Phe Met Asn Val Ser 

AGC CGT TAT ATT GAT TAC AAT ATC AAC CCT 
Ser Arg Tyr He Asp Tyr Asn He Asn Pro 

ATC AAT ATC AAC GGA AAC CAC ATA GAG GAA 
He Asn He Asn Gly Asn His He Glu Glu 

TTA TTA CAA GAT AAG GGG TTA TTA TTG AGT 
Leu Leu Gin Asp Lys Gly Leu Leu Leu Ser 

AAC ATT TTA AGC CTT TCT GTC CTT CAC AAC 
Asn He Leu Ser Leu Ser Val Leu His Asn 

TTT ACC CCT CCC ACC TTA GAG GAT TAC ATT 
Phe Thr Pro Pro Thr Leu Gin Asp Tyr He 

GAA GCT GTT GGG GGG AAT AAC GCT ATC AAG 
Glu Ala Val Gly Gly- Asn Asn Ala He Lys 

CCG CTT TTT GCG CCG ATT TAT TTA GAA AAC 
Pro Leu Phe Ala Pro He Tyr Leu Glu Asn 

CTT CAA AAC ACC GCA AGC TTG ATT TCT AAC 
Leu Gin Asn Thr Ala Ser Leu He Ser Asn 

ATG GCG AGT TAC ACC CAA CAA ACC AGC CGT 
Met Ala Ser Tyr Thr Gin Gin Thr Ser Arg 

GAG TCC AAT TTT TCA GAG CGC TTG TTA GAG 
Glu Ser Asn Phe Ser Glu Arg Leu Leu Glu 

GAG GTT TTT GTC AAA TAC TCT CAA CTC AGC 
Glu Val Phe Val Lys Tyr Ser Gin Leu Ser 

GGA GCG AGC TTT ATT TCT GGG GGC AAT GGC 
Gly Ala Ser Phe He Ser Gly Gly Asn Gly 

GTT AAA AGC GTG ATC CTT GGG GGT TAT GTG 
Val Lys Ser Val He Leu Gly Gly Tyr Val 

CAT TCT TTG GCT AAT AAT GTG GAT GTG GGG 
His Ser Leu Ala Asn Asn val Asp Val Gly 
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Val Thr Met Leu Asn Ala Ser Asn Gly Leu Lys He 

CAA GGC AAT CTG TTT ATC AAC GCT AGC TGC GTG CAA 
Gin Gly Asn Leu Phe He Asn Ala Ser Cys Val Gin 

AAC CCT TGC ACC ACC GCT CAA AAT AAC GCT TCT TCT 
Asn Pro Cys Thr Thr Ala Gin Asn Asn Ala Ser Ser 

TTA AAT AAT AAC GAT GAA AGC TTG GTG GTT ACG GCG 
Leu Asn Asn Asn Asp Glu Ser Leu Val Val Thr Ala 

GCT AAC GGG GTG GTT GAT TTT TCA AAA ATT AAA GGC 
Ala Asn Gly Val Val Asp Phe Ser Lys He Lys Gly 

AAT AAC GCT CAA TTC CAA GCC AAC AAC CTC ACG ATT 
Asn Asn Ala Gin Phe Gin Ala Asn Asn Leu Thr He 

AGC TTT GTA ACG AAT AAC TTA AAC ATT CAA GGA GCG 
Ser Phe Val Thr Asn Asn Leu Asn He Gin Gly Ala 

GTG CTT CAA AAT TTA GTG ATC GCT TCA AAC GCT TCT 
Val Leu Gin Asn Leu Val He Ala Ser Asn Ala Ser 

GGG GGG GCA TTG AAT AAT TTG GGA GCG ATC CAT TTT 
Gly Gly Ala Leu Asn Asn Leu Gly Ala He His Phe 

CCG CTC ATT CAA GTA GGG GGG ATC ATT AAT CTC AAC 
Pro Leu He Gin Val Gly Gly He He Asn Leu Asn 

GTG GCT AAT GGC GGA ACT TAC ACT TTA TTA AAA AGC 
Val Ala Asn Gly Gly Thr Tyr Thr Leu Leu Lys Ser 

AAC AGC TTG CAA TCG TAT TTG AAG CTC TAT ACC TTA 
Asn Ser Leu Gin Ser Tyr Leu Lys Leu Tyr Thr Leu 

AAA AAC GGC GTA TTG ACT TAT TTG GGC CAA CGG GTT 
Lys Asn Gly Val Leu Thr Tyr Leu Gly Gin Arg Val 

GTA GCA CTA CCT AAC TCA AAC AAC GCC TCT CAA AAC 
Val Ala Leu Pro Asn Ser Asn Asn Ala Ser Gin Asn 

CAG ATT AAA ATG TCT TAT GGT AAT AAA GTG ATG GAC 
Gin He Lys Met Ser Tyr Gly Asn Lys Val Met Asp 

GTG GGC ATT CAA GGA CAA AGC GCA CTC AAT CAA ATT 
Val Gly He Gin Gly Gin Ser Ala Leu Asn Gin He 

TGG CTT TCA ACA TTG ATG ATG GAG ACT AAA GAA AAC 
Trp Leu Ser Thr Leu Met Met Glu Thr Lys Glu Asn 

CAC TCT TTA AAT GAA ATC TTA GGC GTA ACA AAA GAT 
His Ser Leu Asn Glu He Leu Gly Val Thr Lys Asp 

CCT AAT TTT AGA AAT AAC GCT ACC AGC CTT TTA GAA 
Pro Asn Phe Arg Asn Asn Ala Thr Ser Leu Leu Glu 

TTG ACA AAA CTC TCT GAT TTT AGG GCT AGA GAG GGA 
Leu Thr Lys Leu Ser Asp Phe Arg Ala Arg Glu Gly 

CTT AAA AAC AAG CGT TTT AGC GAT CCT AAC CCT AGT 
Leu Lys Asn Lys Arg Phe Ser Asp Pro Asn Pro Ser 

AAA CAC CCC AAT AAC CTT TGG ATT CAA GGG GTG GGA 
Lys His Pro Asn Asn Leu Trp He Gin Gly Val Gly 

ACG CTT TAT GGC TTG AAT GTG GGC TAT GAC CGA TTG 
Thr Leu Tyr Gly Leu Asn Val Gly Tyr Asp Arg Leu 

GCT TAT GGC TAT AGC GGT TTT AAC GGG AAC ATC ATG 
Ala Tyr Gly Tyr Ser Gly Phe Asn Gly Asn He Met 

ATG TAT GCG AGG GCT TTT TTG AAA AGA AAC GAA TTC 
Met Tyr Ala Arg Ala Phe Leu Lys Arg Asn Glu Phe 
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ACT TTG AGC GCG AAT GAA ACT 
Thr Leu Ser Ala A3n Glu Thr 

TCT GTG TTG AAC CAA CGC TAC 
Ser Val Leu Asn Gin Arg Tyr 

GAT TTC ATG TTC AAA CAA AAA 
Asp Phe Met Phe Lys Gin Lys 

GGC TTG AGC GGG ATG AAA GGT 
Gly Leu Ser Gly Met Lys Gly 

CCT TCT AAC GAA TCG GTT TTA 
Pro Ser Asn Glu Ser Val Leu 

TCC TAT TAT TTT GTA ACG GCG 
Ser Tyr Tyr Phe Val Thr Ala 

GTG CGT TTT GTG GGT GAA AAC 
Val Arg Phe Val Gly Glu Asn 

GTG ATC ACA GGA GGC GAA ATG 
Val lie Thr Gly Gly Glu Met 

ATG GGC TTG CAA TAC CAA GAT 
Met Gly Leu Gin Tyr Gin Asp 
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TAT GGA GGC AAT GCG AGT CAT 
Tyr Gly Gly Asn Ala Ser His 

AAC TAC AAC ACC TGG ACA ACG 
Asn Tyr Asn Thr Trp Thr Thr 

AGC GTG GTG CTA AAA CCT CAA 
Ser Val Val Leu Lys Pro Gin 

AAA ATG CAA AAT CCA GCT TAC 
Lys Met Gin Asn Pro Ala Tyr 

ACG CTC AAC ATG GGG TTA GAG 
Thr Leu Asn Met Gly Leu Glu 

AGG TTG GGT AGG GAT CTT TTG 
Arg Leu Gly Arg Asp Leu Leu 

ACT TTA TTG TAC CGC AAG GGG 
Thr Leu Leu Tyr Arg Lys Gly 

CAT TTG TGG CGT TTG ATG TAT 
His Leu Trp Arg Leu Met Tyr 

CTT AAT ATC ACT GGG AAT GTG 
Leu Asn lie Thr Gly Asn Val 
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ATC AAT TCT TCT AAT TCC TTG CTC 
lie Asn Ser Ser Asn Ser Leu Leu 

AGC GTG AAT GGG AAT TAC GGC TAT 
Ser Val Asn Gly Asn Tyr Gly Tyr 

GTG GGC TTG AGC TAT CAT TTC ATA 
Val Gly Leu Ser Tyr His Phe lie 

CAA CAA TTC GTC ATG CAT TCA AAC 
Gin Gin Phe Val Met His Ser Asn 

AGC CGT AAA TAT TTT GGT AAA AAT 
Ser Arg Lys Tyr Phe Gly Lys Asn 

ATC AAA GCT AAA GGC GAC AAT GTG 
lie Lys Ala Lys Gly Asp Asn Val 

GAA ATT TTT AAC ACT TTT GCG AGC 
Glu lie Phe Asn Thr Phe Ala Ser 

GTG AAT GCG GGG GTG GGG CTT AAA 
Val Asn Ala Gly Val Gly Leu Lys 

GGC ATG CGA GTG GCG TTT TAG 
Gly Met Arg Val Ala Phe 



HPC001 

ATG AAA TTT TTA CGC TCT GTT TAT GCA TTT 
Met Lys Phe Leu Arg Ser Val Tyr Ala Phe 

GTG CTG TTG GTT ANC TTT TTT GTC GCG CAA 
Val Leu Leu Val ? Phe Phe Val Ala Gin 

GGC ACG CTC TAT GAG GGC GAT ATG CTC TTT 
Gly Thr Leu Tyr Glu Gly Asp Met Leu Phe 

CCT AAA ATC CCA TGG ATT GAG CTT CCT GTT 
Pro Lys lie Pro Trp lie Glu Leu Pro Val 

ATA GAG GGG GAT CGC CCT AAA CGC GGC GAA 
lie Glu Gly Asp Arg Pro Lys Arg Gly Glu 

AAA TCT TAC TAT GTC AAA AGG AAT TTT GCT 
Lys Ser Tyr Tyr Val Lys Arg Asn Phe Ala 

GAG GGG TTT TAT TTG CAC CCT TTT GAG AGC 
Glu Gly Phe Tyr Leu His Pro Phe Glu Ser 

TAC CCA GAT GCT ATG ACT AAA GAA TTT ATG 
Tyr Pro Asp Ala Met Thr Lys Glu Phe Met 

AGT AAG CAT CCG GGT ATC CAT TAC CAA AAA 
Ser Lys His Pro Gly lie His Tyr Gin Lys 

TTA GCC ACT CAA GGC GCG GAA GCT AAT ATC 
Leu Ala Thr Gin Gly Ala Glu Ala Asn lie 

AAG GTG TTT TAT AAA AAA ATC AAT GAC GAT 
Lys Val Phe Tyr Lys Lys lie Asn Asp Asp 

AAT TCT AGC GAC TCG CGC TTT TGG GGG AGT 
Asn Ser Ser Asp Ser Arg Phe Trp Gly Ser 

TGG TTT GTT TAT TTC AGT TTG AGT TTA AAA 
Trp Phe Val Tyr Phe Ser Leu Ser Leu Lys 

CCC AAA AAA CGC TAT TTG GTG CGT TGG GAG 
Pro Lys Lys Arg Tyr Leu Val Arg Trp Glu 

AAA ATC ATT AAA AAA GAA AAA GCA ACG CAT 
Lys He He Lys Lys Glu Lys Ala Thr His 



TGC TCC AGT TGG GTG GGG ACG ATT GTT ATT 
Cys Ser Ser Trp Val Gly Thr He Val He 

GCC TTT ATC ATT CCC TCT CGC TCT ATG GTA 
Ala Phe He He Pro Ser Arg Ser Met Val 

GTC AAA AAA TTT TCT TAC GGC ATC CCC ATT 
Val Lys Lys Phe Ser Tyr Gly He Pro He 

ATG CCT GAT TTT AAA AAT AAC GGG CAT TTG 
Met Pro Asp Phe Lys Asn Asn Gly His Leu 

GTG GTG GTG TTT ATC CCT CCC CAT GAA AAA 
Val Val val Phe He Pro Pro His Glu Lys 

ATT GGG GGC GAT GAG GTG TTA TTC ACT AGT 
He Gly Gly Asp Glu Val Leu Phe Thr Ser 

GGC ACG GAC AAA ACT TAC ATC GCT AAA CAT 
Gly Thr Asp Lys Thr Tyr He Ala Lys His 

GGT AAA ATT TTT GTT TTA AAC CCT TAT AAA 
Gly Lys He Phe Val Leu Asn Pro Tyr Lys 

GAC AAT GAA ACC TTC CAT TTA ATG GAG CAG 
Asp Asn Glu Thr Phe His Leu Met Glu Gin 

AGC ATG CAA CTC ATT CAA ATG GAG GGC GAA 
Ser Met Gin Leu He Gin Met Glu Gly Glu 

GAA TTT TTC ATG ATC GGC GAT AAC AGG GAT 
Glu Phe Phe Met He Gly Asp Asn Arg Asp 

GTG GCT TAT AAA AAT ATC GTG GGT TCG CCA 
Val Ala Tyr Lys Asn He Val Gly Ser Pro 

AAT AGC CTG GAA ATG GAT GCA GAA AAT AAC 
Asn Ser Leu Glu Met. Asp Ala Glu Asn Asn 

CGC ATG TTT AAA AGC GTT GAA GGC TTA GAA 
Arg Met Phe Lys Ser Val Glu Gly Leu Glu 

TAA 
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HPC042 

ATG AAA GAA TTT AAG ATT CTA 
Met Lys Glu Phe Lya lie Leu 

CCT TAT GCG CAT TCG GTG ATG 
Pro Tyr Ala His Ser Val Met 

CCG ATG GAT TTA AAA AAT GGC 
Pro Met Asp Leu Lys Asn Gly 

TGC CAT GGC ATT AAA TCC CAA 
Cys His Gly He Lys Ser Gin 

GGG GTC GTG CCA CCG GAT TTA 
Gly Val Val Pro Pro Asp Leu 

ATC AAA GAC CCC GTG AAA ACG 
He Lys Asp Pro Val Lys Thr 

CCG GCG TTT TCT CAA TTT AGC 
Pro Ala Phe Ser Gin Phe Ser 

CCT AAA AGT TTG AGC GAT AAG 
Pro Lys Ser Leu Ser Asp Lys 

GCT AAA GAT AAG GCC TTT AGC 
Ala Lys Asp Lys Ala Phe Ser 

TTG TCC ATG ATG ATT AGA GCT 
Leu Ser Met Met He Arg Ala 

CTT 
Leu 
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ATC ATC CTT ATT GTG GTG GTA 
He He Leu He Val Val Val 

CAC CCT AAA GTC GCT CCG GCA 
His Pro Lys Val Ala Pro Ala 

GAT GCT AAT AAG GGC AAA CAG 
Asp Ala Asn Lys Gly Lys Gin 

AAC ATT CCA GCC CCT ATG GAC 
Asn He Pro Ala Pro Met Asp 

AGC CAT GTG GCT GGG GTT TTG 
Ser His Val Ala Gly Val Leu 

GCG AAA TTG AGC CAT AAG TTC 
Ala Lys Leu Ser His Lys Phe 

GAT CAA GAT TTG AGC GAT ATT 
Asp Gin Asp Leu Ser Asp He 

GAA GTG TTC GCA CAA AGC TGT 
Glu Val Phe Ala Gin Ser Cy3 

GAT CCT AAA GAT CTA GCC AAT 
Asp Pro Lys Asp Leu Ala Asn 

AAA GGC GAA CAT GGC TTG AAT 
Lys Gly Glu His Gly Leu Asn 



GGC GTG ATT TAT TAT GGG GTT GAG 
Gly Val He Tyr Tyr Gly val Glu 

GAT TTT GCT TTC AAG GAT TTA GAG 
Asp Phe Ala Phe Lys Asp Leu Glu 

CTT GTA GCC GAA AAT TGC ACC GCT 
Leu Val Ala Glu Asn Cys Thr Ala 

AGC CTT AGC GCG AGC AAC TCT TTT 
Ser Leu Ser Ala Ser Asn Ser Phe 

AAC GCG AAT TTC TTA GCC CAC TTC 
Asn Ala Asn Phe Leu Ala His Phe 

AAC GAT GAA AGG CCC TAT CCT ATG 
Asn Asp Glu Arg Pro Tyr Pro Met 

GTG GCG TAT CTC ACT TCT ATT TTG 
Val Ala Tyr Leu Thr Ser He Leu 

CAA AGG TGC CAT AGC TTG GAT TAT 
Gin Arg Cys His Ser Leu Asp Tyr 

TAT TTA GGC TCT CAT GCA CCT GAT 
Tyr Leu Gly Ser His Ala Pro Asp 

ATT TTC ATC AAC GAT CCG CAA AAG 
He Phe He Asn Asp Pro Gin Lys 



HPC065 

ATG AAT AAA CCA TTT TTA ATC TTA CTC ATA GCC CTA ATT GTC TTT AGC GGC TGT AAC ATG AGA AAA 
Met Asn Lys Pro Phe Leu He Leu Leu He Ala Leu He Val Phe Ser Gly Cys Asn Met Arg Lys 

TAT TTC AAA CCC GCT AAA CAC CAA GTT AAA GGC GAA GCG TAT TTC CCT AAT CAT TTG CAA GAA AGT 
Tyr Phe Lys Pro Ala Lys His Gin Val Lys Gly Glu Ala Tyr Phe Pro Asn His Leu Gin Glu Ser 

ATC GTT TCG TCT AAT CGT TAT GGA GCC ATT TTG AAA AAT GGA GCG GTT ATA GGC GAT AAA GGT TTA 
He Val Ser Ser Asn Arg Tyr Gly Ala He Leu Lys Asn Gly Ala Val He Gly Asp Lys Gly Leu 

ACG CAG CTA AGA ATC GGT AAG AAT TTC AAT TAT GAA AGC AGT TTT TTA AAT GAG AGT CAG GGG TTT 
Thr Gin Leu Arg He Gly Lys Asn Phe Asn Tyr Glu Ser Ser Phe Leu Asn Glu Ser Gin Gly Phe 

TTC ATC CTT GCG CAA GAT TGT TTG AAC AAG ATT GAT AAA AAA ACA AGC AAA AAC AAG GTG GCT AAA 
Phe He Leu Ala Gin Asp Cys Leu Asn Lys He Asp Lys Lys Thr Ser Lys Asn Lys val Ala Lys 

AGT GAG GAA ACG GAG CTG AAA TTA AAG GGC GTT GAA GCC GAA GTC CAA GAT AAA GTC TGT CAT CAA 
Ser Glu Glu Thr Glu Leu Lys Leu Lys Gly Val Glu Ala Glu Val Gin Asp Lys Val Cys His Gin 

GTG GAA TTG ATT AGC AAT AAC CCT AAC GCC AGC CAA CAA TCT ATC GTT ATC CCT TTG GAG ACT TTT 
Val Glu Leu He Ser Asn Asn Pro Asn Ala Ser Gin Gin Ser He Val He Pro Leu Glu Thr Phe 

GCC TTG AGC GCA AGC GTT AAA GGG AAT CTT TTA GCG GTG . GTG TTA GCG GAC AAT TCA GCG AAT TTA 
Ala Leu Ser Ala Ser Val Lys Gly Asn Leu Leu Ala Val Val Leu Ala Asp Asn Ser Ala Asn Leu 

TAC GAC ATC ACT TCT CAA AAA TTG CTT TTT AGT GAG AAA GGT TCC CCA AGC ACC ACG ATC AAT TCT 
Tyr Asp lie Thr Ser Gin Lys Leu Leu Phe Ser Glu Lys Gly Ser Pro Ser Thr Thr He Asn Ser 

TTA ATG GCG ATG CCT ATT TTT ATG GAT ACG GTC GTG GTG TTC CCC ATG CTA GAT GGG CGT TTG TTG 
Leu Met Ala Met Pro He Phe Met Asp Thr Val Val Val Phe Pro Met Leu Asp Gly Arg Leu Leu 

GTC GTG GAT TAT GTG CAT GGA AAC CCT ACG CCT ATT AGA AAC ATT GTT ATC AGC AGC GAT AAG TTT 
Val Val Asp Tyr Val His Gly Asn Pro Thr Pro He Arg Asn He Val He Ser Ser Asp Lys Phe 

TTT AAC AAT ATC ACT TAC CTT ATC GTA GAT GGC AAT AAC ATG ATC GCT TCT ACA GGG AAA AGA ATA 
Phe Asn Asn He Thr Tyr Leu He Val Asp Gly Asn Asn Met He Ala Ser Thr Gly Lys Arg He 

CTC TCA GTC GTG AGC GGT CAA GAG TTC AAC TAT GAT GGG GAT ATT ATA GAT TTG CTT TAT GAT AAG 
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Leu Ser Val Val Ser Gly Gin Glu Phe Asn Tyr Asp Gly Asp lie He Asp Leu Leu Tyr Asp Lys 

GGG ACT TTA TAC GTG CTC ACG CTA GAC GGG CAG ATT TTG CAA ATG GAT AAG AGT TTG AGG GAA TTA 
Gly Thr Leu Tyr Val Leu Thr Leu Asp Gly Gin He Leu Gin Met Asp Lys Ser Leu Arg Glu Leu 

AAC AGC GTG AAA CTG CCC TTT GCT TCG CTC AAT ACC ATT GTA TTA AAC CAT AAT AAA TTG TAT TCT 
Asn Ser Val Lys Leu Pro Phe Ala Ser Leu Asn Thr lie Val Leu Asn His Asn Lys Leu Tyr Ser 

TTA GAA AAG CGT GGG TAT GTG ATA GAA GTG GAT TTG AAT GAT TTT GAT TCG TAT AAT GTC TAT AAA 
Leu Glu Lys Arg Gly Tyr Val He Glu Val Asp Leu Asn Asp Phe Asp Ser Tyr Asn Val Tyr Lys 

ACG CCA ACT ATA GGC AGT TTT ARG TTT TTT TCA TCC AAT CGT TTG GAT AAA GGG GTG TTT TAT GAT 
Thr Pro Thr He Gly Ser Phe ? Phe Phe Ser Ser Asn Arg Leu Asp Lys Gly Val Phe Tyr Asp 

AAA AAT CGG GTG TAT TAC GAT CGC TAC TAT TTA GAT TAT AAC GAT TTT AAA CCA AAA CTT TAT CCC 
Lys Asn Arg Val Tyr Tyr Asp Arg Tyr Tyr Leu Asp Tyr Asn Asp Phe Lys Pro Lys Leu Tyr Pro 

GTT GTG GAA AAA TCG GCA TCT AAA AAA TCT CAA AAA GGC GAA AAA GGG AAC ACT CCC ATT TAT TTG 
Val Val Glu Lys Ser Ala Ser Lys Lys Ser Gin Lys Gly Glu Lys Gly Asn Thr Pro He Tyr Leu 

CAA GAA AGG CAT AAA GCT AAA GAA AAG CCT TTA GAA GAA AAC AAA GTT AAG CCA AGA AAT AGC GGG 
Gin Glu Arg His Lys Ala Lys Glu Lys Pro Leu Glu Glu Asn Lys Val Lys Pro Arg Asn Ser Gly 

TTT GAA GAA GAA GAA GTT AAA ACC GGA AGC CGT GAT ATG GAG CCT ACT AAC AAT CAA AAT AAC GCT 
Phe Glu Glu Glu Glu Val Lys Thr Gly Ser Arg Asp Met Glu Pro Thr Asn Asn Gin Asn Asn Ala 

ATC CAA AAA GGC ATA AAA GAA AGT CAA GAA AAC AAA AAC GCT CCT GCT TCA AAA GAG GGT AAC CAA 
He Gin Lys Gly He Lys Glu Ser Gin Glu Asn Lys Asn Ala Pro Ala Ser Lys Glu Gly Asn Gin 

AAA GGT GCA GAA AAC GCT CCT GTT TCA AAA GAG GAT AAC GCT ATT AAA GAA GCG CCA AAA CTC AGC 
Lys Gly Ala Glu Asn Ala Pro Val Ser Lys Glu Asp Asn Ala He Lys Glu Ala Pro Lys Leu Ser 

CCT AAA GAA GAA AAA CGC CGC TTG AAA GAA GAA AAG AAA AAA GCC AAA GCC GAA CAA AGA GCG AGA 
Pro Lys Glu Glu Lys Arg Arg Leu Lys Glu Glu Lys Lys Lys Ala Lys Ala Glu Gin Arg Ala Arg 

GAA TTT GAA CAA AGA GCG AGA GAG CAT CAA GAA AGA GAT GAA AAA GAG CTT GAA GAA AGA AGA AAA 
Glu Phe Glu Gin Arg Ala Arg Glu His Gin Glu Arg Asp Glu Lys Glu Leu Glu Glu Arg Arg Lys 



GCT TTA GAA ATG AAT AAG AAG TAG 
Ala Leu Glu Met Asn Lys Lys 
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GAT 
Asp 


CAC 
His 


CCT 
Pro 


ATT 
He 


GCT 
Ala 


ATG 
Met 


GGT 
Gly 


TTT 
Phe 


TGG 
Trp 


CTT 
Leu 


TTT 
Phe 


AGC ACG 
Ser Thr 


ACT 
Thr 


GTG 
Val 


GTG 
Val 


CTA 
Leu 


TTT 

Phe 


GAT ATA 

Asp He 


GTG 
Val 


GTG 
Val 


GTT 
Val 


GCG 
Ala 


GAG 
Glu 


CGT 
Arg 


TTT 
Phe 


TGC 
Cys 


ATT 
He 


TAT 
Tyr 


TTA 
Leu 


TGC 
Cys 


CCT TAC GCT AGG GTG CAA TCG GTG 
Pro Tyr Ala Arg Val Gin Ser Val 


TTG TAT GAC 
Leu Tyr Asp 


AAT 
Asn 


GAC 
Asp 


ACC 
Thr 


TTA 
Leu 


AAC 
Asn 


CCT 
Pro 


ATT 
He 


TAT GAT 
Tyr Asp 


GAA 
Glu 


AAG 
Lys 


CGC GGC GGA GTG 
Arg Gly Gly Val 


CTT TAT AAC AAT CAG GGC CAT 
Leu Tyr Asn Asn Gin Gly His 


CTC 
Leu 


TTC 
Phe 


CCC 
Pro 


TTA 
Leu 


CCC 
Pro 


CCC 
Pro 


AAA 
Lys 


AAA 
Lys 


CGC 
Arg 


AGC 
Ser 


CCA 
Pro 


GAA 
Glu 


AAC GAA 
Asn Glu 


TGC 
Cys 


GTG 
Val 


AAT 
Asn 


TGC 
Cys 


TTG 
Leu 


CAT TGC 
His Cys 


GTG 
Val 


CAG 
Gin 


GTT 
Val 


TGC 
Cys 


CCC 
Pro 


ACA 
Thr 


CAT 
His 


ATT GAT 
He Asp 


ATT 
He 


AGG 
Arg 


AAA 

Lys 


GGC TTG CAA 
Gly Leu Gin 


TTA 
Leu 


GAA 
Glu 


TGC 
Cys 


ATC 
He 


AAT 
Asn 


TGT TTA 
Cys Leu 


GAA 
Glu 


TGC 
Cys 


GTG 
Val 


NAT 


GCA TGC ACC 
Ala Cys Thr 


ATT 
He 


ACC 
Thr 


ATG 
Met 


GCT 
Ala 


AAA 
Lys 


TAC 
Tyr 


AAC CGC 
Asn Arg 


CCT 
Pro 


TCA 
Ser 


CTC 
Leu 


ATC 
He 


CAA 
Gin 


TGG TCT 
Trp Ser 


TCA 
Ser 


ACC 
Thr 


AAC 
Asn 


GCC 
Ala 


ATT 
He 


AAC 
Asn 


ACG 
Thr 


CGC 
Arg 


CAA 
Gin 


AAA 
Lys 


GTG 
Val 


CGC 
Arg 


CTG 
Leu 


GTG CGT 
Val Arg 


TTA 
Leu 


AAA 
Lys 


ACG 
Thr 


ATC 
He 


GCT 
Ala 


TAC ATG 
Tyr Met 


GGG GTT 
Gly Val 


ATC 
He 


GCT 
Ala 


GTT 
Val 


GTG 
Val 


ATC 
He 


GCT 
Ala 


CTT 
Leu 


TTA 
Leu 


GCC 
Ala 


ATC 

He 


ACT 
Thr 


TCG TTT 
Ser Phe 


AAA 
Lys 


AAA 
Lys 


GAA 
Glu 


CGC 
Arg 


ATG 
Met 


CTC TTA GAC 
Leu Leu Asp 


ATT 
He 


AAC 
Asn 


CGC AAC AGC GAT CTG TAT GAA 
Arg Asn Ser Asp Leu Tyr Glu 


TTG 
Leu 


CGC 
Arg 


TCT 
Ser 


AGT GGG TAT 
Ser Gly Tyr 


GTG 
val 


GAT 
Asp 


AAC 
Asn 


GAT 
Asp 


TAT GTG 
Tyr Val 


TTT 
Phe 


TTA 
Leu 


TTC 
Phe 


CAC AAC ACG GAC AAT AAA GAC CAT 
His Asn Thr Asp Asn Lys Asp His 


GAG 
Glu 


TTT 
Phe 


TAT TTC 
Tyr Phe 


AAA 
Lys 


ATT 
He 


TTA GGG CAA 
Leu Gly Gin 


AAA GAC 
Lys Asp 


ATC 
He 


CAA 
Gin 
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ATC AAA AAG CCT TTA AAT CCT ATC GCC ATT AAA GCC G 
He Lys Lys Pro Leu Asn Pro lie Ala He Lys Ala 



HPC074 

GAT CAA AAT AAC GAT TTG GCG 
Asp Gin Asn Asn Asp Leu Ala 

AGC TCG CCT TCA AAG TAT TTC 
Ser Ser Pro Ser Lys Tyr Phe 

AAG TAT TTC AGA ACC TTT AGC 
Lys Tyr Phe Arg Thr Phe Ser 

TTA GTG TCG TTG CTT TTA TTT 
Leu Val Ser Leu Leu Leu Phe 

AGT TTT GAT ATT AAA GAA GTG 
Ser Phe Asp He Lys Glu val 

CTG GTC AAG GCG ATT TTT GAA 
Leu Val Lys Ala He Phe Glu 

CAC CGC ACG ATG ATC AGA TTT 
His Arg Thr Met He Arg Phe 

GTG TTT AAA TTC AGC GTG AGC 
Val Phe Lys Phe Ser Val Ser 



TTT GTG GTG TGC TTG CAA ATC 
Phe Val Val Cys Leu Gin He 

AGA ACC TTT AGC GAA GGG AGC 
Arg Thr Phe Ser Glu Gly Ser 

GAA GGG AGC ATG GTC ATG TAT 
Glu Gly Ser Met Val Met Tyr 

GTG AAA TGC ATT TCT AGC TTT 
Val Lys Cys He Ser Ser Phe 

TTC CAC CCC ATT GTG CTT TTA 
Phe His Pro He Val Leu Leu 

GAG GAA GTT TTG GGT AAA AAT 
Glu Glu Val Leu Gly Lys Asn 

TTA GGC TCT ATC ATT ATC GCA 
Leu Gly Ser He He He Ala 

GAA CCG NNN NAA ATC ACT TAT 
Glu Pro ? ? He Thr Tyr 



CCT TTG AGG GTA GCG ATT GAA ATC 
Pro Leu Arg Val Ala He Glu He 

ATG GTC ATG TAT TTT TCG CCT TCA 
Met Val Met Tyr Phe Ser Pro Ser 

TTT ATG ATT TCT ATC ATG CTC ACT 
Phe Met He Ser He Met Leu Thr 

TGG ACA GCG ATT GTC AAT TTT AGC 
Trp Thr Ala He Val Asn Phe Ser 

ACC CTA GCC TTA GCC ACC TTT GAT 
Thr Leu Ala Leu Ala Thr Phe Asp 

AGC GGG GAC AAC CAC CAT GCG ATC 
Ser Gly Asp Asn His His Ala He 

TTA GCC ATT GAA GCG TTA ATG TTA 
Leu Ala He Glu Ala Leu Met Leu 

GCG GTG TAT TTG GCT 
Ala val Tyr Leu Ala 



HPC083 

ATG CGC TCT CCA AAT TTA GAA AAA GAA GAA 
Met Arg Ser Pro Asn Leu Glu Lys Glu Glu 

ATG CGT TTA TGC CCC TTG TAT TGG CGC ATC 
Met Arg Leu Cys Pro Leu Tyr Trp Arg He 

TTA TTG AGC GAT CTT TTA GAC GCA TGC GAT 
Leu Leu Ser Asp Leu Leu Asp Ala Cys Asp 

TAC CAC AGC GTG TTT GTT GTA ATG AGT TTT 
Tyr His Ser Val Phe Val Val Met Ser Phe 

TGT TTG TGC AAG ATG AGT TTG GCT AAA CTG 
Cys Leu Cys Lys Met Ser Leu Ala Lys Leu 

GAT TGC CCC AGT AGG GCT ATT TTA TTG AAG 
Asp Cys Pro Ser Arg Ala lie Leu Leu Lys 

TTT TTA TGG TTT GTA GTG TTT AAA AAC CCC 
Phe Leu Trp Phe Val Val Phe Lys Asn Pro 

CTT TTG GTG TTG TTT TAA 
Leu Leu Val Leu Phe 



ACT GAA ATC ATA GAA ACA CTC CTT ATG CGT GAA AAA 
Thr Glu He He Glu Thr Leu Leu Met Arg Glu Lys 

TTA GCG TTT TTA ACC GAT GGT TTG TTG GTG GCG TTT 
Leu Ala Phe Leu Thr Asp Gly Leu Leu Val Ala Phe 

TTC TTG CAT TCT TTA TAT TGG CTG ACT AAC CCC ATT 
Phe Leu His Ser Leu Tyr Trp Leu Thr Asn Pro He 

ATC GTC TTG TAT GGC GTT TAT GAA ATC TTT TTT GTG 
He Val Leu Tyr Gly Val Tyr Glu He Phe Phe Val 

GTT TTT AGG ATT AAA ATT ATT GAT ATT TAT TTA GCA 
Val Phe Arg He Lys He He Asp He Tyr Leu Ala 

CGT TTA GGG TTA AAG ATC GTG GTT TTT CTA TGC CCC 
Arg Leu Gly Leu Lys He Val Val Phe Leu Cys Pro 

TAT CAT AGG GCA TGG CAT GAA GAA AAA AGC AAA AGT 
Tyr His Arg Ala Trp His Glu Glu Lys Ser Lys Ser 



HPC084 



ATG 
Met 


ATT 
He 


TAT 
Tyr 


TGG 
Trp 


ATG 
Met 


CAA 
Gin 


CGA 
Arg 


TTT 
Phe 


GAC 
Asp 


AAT 
Asn 


GTG 
Val 


ATA 
He 


AAG 
Lys 


GTG 
Val 


CGT 
Arg 


TAT 
Tyr 


GAG 
Glu 


GGT 
Gly 


TTG 

Leu 


CTC 
Leu 


CCC 
Pro 


TTT 
Phe 


TAT 
Tyr 


GTC 
Val 



TTG TAT TTG GCG GTC TTT 
Leu Tyr Leu Ala Val Phe 

GAC AAA CAA AAC CAT AAG 
Asp Lys Gin Asn His Lys 

ACC GCA TCA GGG AAT GCG 
Thr Ala Ser Gly Asn Ala 

GAC ACT AAA ACC AAA GAA 
Asp Thr Lys Thr Lys Glu 

GTT AAA ACC GAT TAT GTG 
Val Lys Thr Asp Tyr Val 

CAA GAC AGC GTG AGC GGG 
Gin Asp Ser Val Ser Gly 



TTT TTG TTG GGT GCA TTA 
Phe Leu Leu Gly Ala Leu 

ATT TTT GAA ATC CTT GCG 
He Phe Glu He Leu Ala 

ATC TTA TTG AAT TAT GAT 
He Leu Leu Asn Tyr Asp 

GCG TTA TTA GAG GGG AAT 
Ala Leu Leu Glu Gly Asn 

AAA TTG AGC TTG AAT GAA 
Lys Leu Ser Leu Asn Glu 

ATT TGG GTG AGC GCG GAT 
He Trp Val Ser Ala Asp 



GAC 
Asp 


GCT 
Ala 


AAA 

Lys 


GAA 
Glu 


ATC 
He 


GCT 
Ala 


GAT 
Asp 


AAA 
Lys 


GTG 
Val 


AGC 
Ser 


GCT 
Ala 


AAA 
Lys 


GTG 
Val 


TAT 
Tyr 


ATT 
He 


TTA 
Leu 


GCG 
Ala 


GAC 
Asp 


ATC 
He 


AAG 
Lys 


GTT 
Val 


TAT AGG GGC 
Tyr Arg Gly 


AAA 
Lys 


TAT 
Tyr 


GAA 
Glu 


ATC 
He 


ATT 
He 


TTC 
Phe 


ATT 

He 


GCT 
Ala 


AGC 
Ser 


GGG AAG GAT 
Gly Lys Asp 
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CAA AAA TAT AAG GTT AAA AAC ATG AGO GCT TCA GGG TGC AGC ATT GAT AAC CCC ATT TGG CAT GTC 
Gin Lys Tyr Lys Val Lys Asn Met Ser Ala Ser Gly Cys Ser lie Asp Asn Pro lie Trp His Val 

AAT GCG ACT TCA GGC TCA TTC AAC ATG CAA AAA TCG CAT TTG TCT ATG TGG AAT CCT AAG ATC TAT 
Asn Ala Thr Ser Gly Ser Phe Asn Met Gin Lys Ser His Leu Ser Met Trp Asn Pro Lys lie Tyr 

GTC GGT GAT ATT CCT GTA TTG TAT TTG CCC TAT ATT TTC ATG TCC ACT AGC AAT AAA AGA ACT ACC 
Val Gly Asp lie Pro Val Leu Tyr Leu Pro Tyr lie Phe Met Ser Thr Ser Asn Lys Arg Thr Thr 

GGG TTT TTA TAC CCT GAG TTT GGT ACT TCC AAC TTA GAC GGC TTT ATT TAT TTG CAA CCC TTT TAT 
Gly Phe Leu Tyr Pro Glu Phe Gly Thr Ser Asn Leu Asp Gly Phe lie Tyr Leu Gin Pro Phe Tyr 

TTA GCC CCC AAA AAC TCA TGG GAT ATG ACC TTT ACC CCA CAA ATC CGC TAT AAA AGG GGT TTT GGC 
Leu Ala Pro Lys Asn Ser Trp Asp Met Thr Phe Thr Pro Gin He Arg Tyr Lys Arg Gly Phe Gly 

TTG AAT TTT GAA GCG CGC TAC ATT AAC TCT AAA GAC GAC AGG TTT TTA TTC AAT GCG CGC TAT TTT 
Leu Asn Phe Glu Ala Arg Tyr He Asn Ser Lys Asp Asp Arg Phe Leu Phe Asn Ala Arg Tyr Phe 

AGG AAT TAC ACC CAA TAT GTC AAA CGC TAC GAT TTG AGG AAT CAA AAT ATC TAT GGT TTT GAA TTT 
Arg Asn Tyr Thr Gin Tyr Val Lys Arg Tyr Asp Leu Arg Asn Gin Asn He Tyr Gly Phe Glu Phe 

TTA AGC TCT AGC AGG GAC ACT TTA CAA AAA TAC TTT CAT CTT AAG TCT AAT ATT GAT AAC GGG CAT 
Leu Ser Ser Ser Arg Asp Thr Leu Gin Lys Tyr Phe His Leu Lys Ser Asn He Asp Asn Gly His 

TAC ATT GAC TTT TTA TAC ATG AAC GAT TTG GAT TAT GTG CGT TTT GAA AAG GTT AAT AAG CGC ATC 
Tyr He Asp Phe Leu Tyr Met Asn Asp Leu Asp Tyr Val Arg Phe Glu Lys Val Asn Lys Arg He 

ACA GAC GCC ACG CAC ATG TCT AGG GCG AAT TAC TAT TTG CAA ACA GAA AAC AAT TAT TAC GGC TTG 
Thr Asp Ala Thr His Met Ser Arg Ala Asn Tyr Tyr Leu Gin Thr Glu Asn Asn Tyr Tyr Gly Leu 

AAT ATC AAG TAT TTT TTA AAC CTG AAT AAA ATC AAC AAC AAC CGC ACT TTC CAA TCT GTC CCT AAT 
Asn He Lys Tyr Phe Leu Asn Leu Asn Lys He Asn Asn Asn Arg Thr Phe Gin Ser Val Pro Asn 

TTG CAA TAC CAT AAA TAT TTA AAT TCT TTG TAT TTT AGA AAT TTA TTG TAT TCG GTG GAT TAT CAG 
Leu Gin Tyr His Lys Tyr Leu Asn Ser Leu Tyr Phe Arg Asn Leu Leu Tyr Ser Val Asp Tyr Gin 

TTT AGA AAC ACC GCA AGA GAS ATC GGC TAT GGC TAT GTG CAA AAC GCT TTG AAT GTG CCG GTG GGC 
Phe Arg Asn Thr Ala Arg ? He Gly Tyr Gly Tyr Val Gin Asn Ala Leu Asn Val Pro Val Gly 

TTG CAA TTT TCT TTG TTT AAA AAG TAT TTG TCT TTA GGG CTT TGG AAC GAT CTC CAA CTA TCT AAT 
Leu Gin Phe Ser Leu Phe Lys Lys Tyr Leu Ser Leu Gly Leu Trp Asn Asp Leu Gin Leu Ser Asn 

GTG GCT TTA ATG CAA TCT AAC AAT TCC TTC GTG CCT ACG ATC CCT AAT GAA TCA AGG GAA TTT GGG 
Val Ala Leu Met Gin Ser Asn Asn Ser Phe Val Pro Thr He Pro Asn Glu Ser Arg Glu Phe Gly 

AAC TTT GTG TCT TCA AAT TTT TCC ATG TAT GTC AAT ATG GAT TTA GCC AGA GAA TAC AAC AAG CTT 
Asn Phe Val Ser Ser Asn Phe Ser Met Tyr Val Asn Met Asp Leu Ala Arg Glu Tyr Asn Lys Leu 

TTC CAC ACG ATC CAA TTG GAA GCG ATT TTC AAC ATC CCT TAT TAC MCC TTT AAA AAC GGC TTA TTT 
Phe His Thr lie Gin Leu Glu Ala He Phe Asn He Pro Tyr Tyr ? Phe Lys Asn Gly Leu Phe 

TCT CAA AAC ATG TAT GCT TTA AGC ACG CAA GCC TTA AAC AGC TAC ACT TCG CCT TTA TTG AGA GAT 
Ser Gin Asn Met Tyr Ala Leu Ser Thr Gin Ala Leu Asn Ser Tyr Thr Ser Pro Leu Leu Arg Asp 

TAT GAT TAT CAA GGG CGT TTG TAT GAC TCC GTG TGG AAT CCT AGC AGC ATT TTA CCT AGC GAT GCG 
Tyr Asp Tyr Gin Gly Arg Leu Tyr Asp Ser Val Trp Asn Pro Ser Ser He Leu Pro Ser Asp Ala 



AGC AAT AAA ACG GTG AAT TTA ACC CTA ACG CAA TAC CTT TAT GGC TTA GGA GGG CAA GAG TTG TTG 
Ser Asn Lys Thr Val Asn Leu Thr Leu Thr Gin Tyr Leu Tyr Gly Leu Gly Gly Gin Glu Leu Leu 

TAT TTT AAA ATA TCG CAA CTC ATC AAT CTT GAC GAT AAA GTT TCG CCC TTT AAA ATG CCC CTA GAA 
Tyr Phe Lys He Ser Gin Leu He Asn Leu Asp Asp Lys Val Ser Pro Phe Lys Met Pro Leu Glu 

AGC AAG ATC GGG TTT TCG CCC TTA ACG GGA TTG AAT ATC TTT GGG AAT GTC TTT TAT TCG TTT TAT 
Ser Lys He Gly Phe Ser Pro Leu Thr Gly Leu Asn He Phe Gly Asn Val Phe Tyr Ser Phe Tyr 

CAA AAC CGC CTA GAA GAA ATC TCT GTG AAC GCC AAT TAC CAA CGC AAG TTT TTA AGC TTT AAC CTC 
Gin Asn Arg Leu Glu Glu He Ser Val Asn Ala Asn Tyr Gin Arg Lys Phe Leu Ser Phe Asn Leu 

TCT TAT TTT TTA AGG AAC AAT TTT AGC AGT GGG ATT AAT AGC ATT GTA GAA AAT CTG CGG ATT ATT 
Ser Tyr Phe Leu Arg Asn Asn Phe Ser Ser Gly He Asn Ser He Val Glu Asn Leu Arg He He 
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HPC104 

ATG GAT ATT TAT GCG TTA TAC 
Met Asp lie Tyr Ala Leu Tyr 

ATT GGT GGG GGG TTG ATC ATT 
lie Gly Gly Gly Leu He He 

GGC ATT TCC ATT TTG CAA ATG 
Gly He Ser He Leu Gin Met 

TCG CTT GAT TTT TCT TTA GGC 
Ser Leu Asp Phe Ser Leu Gly 

TTT GTT TTA AAA ATC GTT TCC 
Phe Val Leu Lys He Val Ser 

ATG ATC CAA TTT GTC TTA AAA 
Met He Gin Phe Val Leu Lys 

CAA GGT TTA AAA TTA TTT TTA 
Gin Gly Leu Lys Leu Phe Leu 

GGG GGG ATG CTC ATG GTG CCT 
Gly Gly Met Leu Met Val Pro 

CTA GGG TTA TTT TTC ATC TTG 
Leu Gly Leu Phe Phe He Leu 

ATC AAT AAA GAA GTT CTC TTA 
He Asn Lys Glu Val Leu Leu 

GGG ATT AAA TGG ATC ATG GGG 
Gly He Lys Trp He Met Gly 

GGT TTG TCG TTA TTG ATT ATT 
Gly Leu Ser Leu Leu He He 
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ATA GCG ATA GGG CTT TTT ACT 
He Ala He Gly Leu Phe Thr 

GTC CCT ATC ATG CTC GCA ACC 
Val Pro He Met Leu Ala Thr 

GTG CTT TCA TCG TTC GTG GGA 
Val Leu Ser Ser Phe Val Gly 

TTG TTG ATA GGG GCA GGG GGG 
Leu Leu He Gly Ala Gly Gly 

AGT AAA ATT TTA ATG GTT ATT 
Ser Lys He Leu Met Val He 

CCC AAA AAA AAA GAT TTT ATA 
Pro Lys Lys Lys Asp Phe He 

ATT GGC GCG CTC ACA GGG TTT 
He Gly Ala Leu Thr Gly Phe 

TTG ATG CAT TAT TTT TTA GGG 
Leu Met His Tyr Phe Leu Gly 

TTT TCT TCT ATT TCA GGA GCT 
Phe Ser Ser He Ser Gly Ala 

GCA GGG GCG ATT GTG GGC TTA 
Ala Gly Ala He Val Gly Leu 

CTT TTG AAT GAA AAA ATG CAT 
Leu Leu Asn Glu Lys Met His 

TTA TAC AAA CTC TTT TTT TAA 
Leu Tyr Lys Leu Phe Phe 
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GGC ATT CTA TCA GGG ATT TTT GGC 
Gly He Leu Ser Gly He Phe Gly 

GGG CAT TCT TTT GAA GAA TCC ATC 
Gly His Ser Phe Glu Glu Ser He 

TCT GTT TTG AAT TTC AAA AAA AAA 
Ser Val Leu Asn Phe Lys Lys Lys 

CTG ATA GGG GCA AGT TTT AGC GGA 
Leu He Gly Ala Ser Phe Ser Gly 

TTC NCG CTT TTA GTC GTG TAT TCT 
Phe ? Leu Leu Val Val Tyr Ser 

GCG GAT AAT AAA CGC TAC CCT TTG 
Ala Asp Asn Lys Arg Tyr Pro Leu 

TTT GCC ATC ACT TTA GGG ATT GGT 
Phe Ala He Thr Leu Gly He Gly 

TAT GAT TCT AAA AAA TGC GTG GCG 
Tyr Asp Ser Lys Lys Cys Val Ala 

TTT TCT TTA ATG TAT CAC CAC ATC 
Phe Ser Leu Met Tyr His His He 

GGC TCA GTT ATG GGC GTG AGC ATT 
Gly Ser Val Met Gly Val Ser lie 

AAA ATT TTG ATT TTA GGG GTG TAT 
Lys He Leu He Leu Gly Val Tyr 



HPC11S 

ATG AAA TGT TCG CAT TGC CAG 
Met Lys Cys Ser His Cys Gin 

AAG GAA TTG TAT TTT TGC TGC 
Lys Glu Leu Tyr Phe Cys Cys 

GAG AGC TTT TAT GAC AAA TTA 
Glu Ser Phe Tyr Asp Lys Leu 

GCT TTG GAA TTA GAA CAA GCC 
Ala Leu Glu Leu Glu Gin Ala 

GAA AAA ACG CAT TGT AAC GCT 
Glu Lys Thr His Cys Asn Ala 

AAA AAA GTG AGC GTG AAT TTC 
Lys Lys Val Ser Val Asn Phe 

AAA GAG ATT ATT CAA AAA ATT 
Lys Glu He He Gin Lys Xle 

GCC CTA AAA GCC CAA AAA GAG 
Ala Leu Lys Ala Gin Lys Glu 

ATG AAT TTG ATG TTT ATT GCA 
Met Asn Leu Met Phe He Ala 

ATG GAT AAG CTT ATG CAA AGG 
Met Asp Lys Leu Met Gin Arg 

GTT GTG GGG CGT TTT TTC ATT 



TTG GAG TTT AAA GAA AGT GAG 
Leu Glu Phe Lys Glu Ser Glu 

ACG GGG TGT GCT AGA GTG TAT 
Thr Gly Cys Ala Arg Val Tyr 

AAC GAT TCC ACT TTA GCC CCC 
Asn Asp Ser Thr Leu Ala Pro 

CTT GAA GAA AAC AAT AAA AGC 
Leu Glu Glu Asn Asn Lys Ser 

TGC TTG TGG CTC AAT CAA AAG 
Cys Leu Trp Leu Asn Gin Lys 

ACC ACC CAC CAT TTA CAA ATC 
Thr Thr His His Leu Gin He 

GAG AGT TTG GGT TAT GGG GCT 
Glu Ser Leu Gly Tyr Gly Ala 

CAG CGC TCC TAT TTG CTC ACT 
Gin Arg Ser Tyr Leu Leu Thr 

ATT GCC AAA TAC GCA AGT TAT 
He Ala Lys Tyr Ala Ser Tyr 

AAT TTG GAT CTC GTA TCG CTC 
Asn Leu Asp Leu Val Ser Leu 

AAG GGG GCG TTT TAT GGG ATA 



CTT TTT AAA GAA GTG ATC CAT CAT 
Leu Phe Lys Glu Val He His His 

GCG TTA TTA TTG GAT TTG AAT TTA 
Ala Leu Lieu Leu Asp Leu Asn Leu 

GTA ACG CCC CAA GAT TCA ATG AGC 
Val Thr Pro Gin Asp Ser Met Ser 

GAT TTT ATC CTT AAT CTT TTG CTA 
Asp Phe He Leu Asn Leu Leu Leu 

GTT TTA GAG CGC TTA AAG GGG GTT 
Val Leu Glu Arg Leu Lys Gly Val 

GTG TTT GAC AAG TCC TTA AAC CCT 
Val Phe Asp Lys Ser Leu Asn Pro 

AAA ATT TAT AAC GCA AAA AAT TAC 
Lys lie Tyr Asn Ala Lys Asn Tyr 

TTA AGC GTG GGG TTT TTT GCC ACC 
Leu Ser Val Gly Phe Phe Ala Thr 

GGC GGT GCG AGT TAT GGC ACT GGC 
Gly Gly Ala Ser Tyr Gly Thr Gly 

TTT TTA AGC TTG TTG GTG TTA GTG 
Phe Leu Ser Leu Leu Val Leu Val 

AAA AAT GGC GTT TTG GGC ATG GAT 
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Val Val Gly Arg Phe Phe lie Lys Gly Ala Phe Tyr Gly lie Lys Asn Gly Val Leu Gly Met Asp 

TTG AGC GTG TCT TTT GGA GCG TTA TCG GCA TTT GTT TAT TCC CTT TAT GCC ATG CTG GTG TCC CAA 
Leu Ser Val Ser Phe Gly Ala Leu Ser Ala Phe Val Tyr Ser Leu Tyr Ala Met Leu Val Ser Gin 

GAG ACT TAT TTT GAA GCG AGC AGC ACG ATT TTA ACG CTT GTT TTT GGC TCT AAG TTT TTG GAA TTA 
Glu Thr Tyr Phe Glu Ala Ser Ser Thr lie Leu Thr Leu Val Phe Gly Ser Lys Phe Leu Glu Leu 

AAA GCC AGG CTG TTT GCG AAT GAA AAA TGT CTG GCC CTA GAA TCG CAT GAA ATC CAT AGC GTG ATC 
Lys Ala Arg Leu Phe Ala Asn Glu Lys Cys Leu Ala Leu Glu Ser His Glu lie His Ser Val lie 

GTT GTA GAA AAG GAC AAG CAG ATA GAA AAA CAC CCT AAA GAT GTG GCG ATA GGC TCT GTT GTT TGG 
Val Val Glu Lys Asp Lys Gin lie Glu Lys His Pro Lys Asp Val Ala He Gly Ser Val Val Trp 

GTG CCA AGC GGG GCT AAA ATC GCA CTA GAT GGA GTG CTT TTA AAT AAC GCG AGC GTG GAT GCG TCT 
Val Pro Ser Gly Ala Lys He Ala Leu Asp Gly Val Leu Leu Asn Asn Ala Ser Val Asp Ala Ser 

TTG ATC AGC GGG GAG TTT AAG CCT TTG GAA TTG GGG GTT AAT GAT CTA ATT TTA GGG GGT TAT GTG 
Leu He Ser Gly Glu Phe Lys Pro Leu Glu Leu Gly Val Asn Asp Leu He Leu Gly Gly Tyr Val 

AAT GTG GGC GTG CCT TTT AGC TAT CAA GTG AGC GCG ACT TTT CAA AAC TCA CGC CTT TCT AGT TTG 
Aan Val Gly Val Pro Phe Ser Tyr Gin Val Ser Ala Thr Phe Gin Asn Ser Arg Leu Ser Ser Leu 

TTA GAA ACT TTA AAA AAG AGT TTT TTA GAA AAG CCC TTA ATT GAG AGT AGC GCG AAT AAA ATT GCG 
Leu Glu Thr Leu Lys Lys Ser Phe Leu Glu Lys Pro Leu He Glu Ser Ser Ala Asn Lys He Ala 

GAT ATT TTT TCT AAA GCG GTG TTG TTT TTA GCC TTT GTA AGC TTT TTA TTA TGG CAA TTT GGT TTG 
Asp He Phe Ser Lys Ala Val Leu Phe Leu Ala Phe Val Ser Phe Leu Leu Trp Gin Phe Gly Leu 

GGG GGT AAT TTT GAA AAA GCC TTA ATG GTG TGT ATT AGC GTG TTA GTC ATC AGC TGC CCT TGC GCA 
Gly Gly Asn Phe Glu Lys Ala Leu Met Val Cys He Ser Val Leu Val He Ser Cys Pro Cys Ala 

TTC GCC TTA GCT ACG CCC ATT GCG TTA GTG ATA GGG GTG TTT AAA AAC CCT TTG ATC GTG TTT AAA 
Phe Ala Leu Ala Thr Pro He Ala Leu Val He Gly Val Phe Lys Asn Pro Leu He Val Phe Lys 

GAA GCG TTA TTT TTA GAA ACT CTG GCT AAA GTG GAA AAA ATC TTT ATA GAC AAA ACC G 
Glu Ala Leu Phe Leu Glu Thr Leu Ala Lys Val Glu Lys He Phe He Asp Lys Thr 



HPC120 

ATG CTA CTA ACA ACA CTC AAG CTA AAA TCT 
Met Leu Leu Thr Thr Leu Lys Leu Lys Ser 

TCT CTT GTT TTC GCA -TGT ATC AAT ACC AGC 
Ser Leu Val Phe Ala Cys He Asn Thr Ser 

GAT TTG ACC TCT CCA AAA GAA GTC TCT CAA 
Asp Leu Thr Ser Pro Lys Glu Val Ser Gin 

CAA AGA AAT GAA GCT CAA AAC GAA ACT TCT 
Gin Arg Asn Glu Ala Gin Asn Glu Thr Ser 

TCC ATT TCG TAT ATC GGG CTT TCT TAC ATG 
Ser He Ser Tyr He Gly Leu Ser Tyr Met 

GTG GGC GAT ATT GTG GAT TCT AAA AAA ATA 
Val Gly Asp He val Asp Ser Lys Lys He 

TTT AAA GAC GTT TAT GCC ACT TTT GAA GGC 
Phe Lys Asp Val Tyr Ala Thr Phe Glu Gly 

ATT GCC GGG GTA GAA ATC AAG GGT TAT GGG 
He Ala Gly Val Glu He Lys Gly Tyr Gly 

GGG ATC AAA AAG GGC GAC ACC TTT GAT GAG 
Gly He Lys Lys Gly Asp Thr Phe Asp Glu 

GCT TTA GAG GGG CAG GGC TAT TAT GGG AGC 
Ala Leu Glu Gly Gin Gly Tyr Tyr Gly Ser 

GCG TTA TTA ATT GTG TTT GAT GTG AAT AGG 
Ala Leu Leu He Val Phe Asp Val Asn Arg 

GGG AGT GCG AAA TTA AAA CGC CGC ATG ATT 



ATT AAG GAA ATC AGT ATT AAA AAA TTT ATT CTA TCT 
He Lys Glu He Ser lie Lys Lys Phe He Leu Ser 

GTT GAA GCT TTA GAA AAT GAC GGC TCT AAA CCA AAC 
Val Glu Ala Leu Glu Asn Asp Gly Ser Lys Pro Asn 

GAA GCT CAA AGA AAT GAG ACT CAA AGA AAT GAA GCT 
Glu Ala Gin Arg Asn Glu Thr Gin Arg Asn Glu Ala 

CAA TCC AAT CAA ACG CCT AAA GAA ATG AAA GTC AAA 
Gin Ser Asn Gin Thr Pro Lys Glu Met Lys Val Lys 

TCT GAC ATG CTT GCT AAT GAG ATT GTA AAG ATT CGT 
Ser Asp Met Leu Ala Asn Glu He Val Lys He Arg 

GAC ACC GCT GTT TTG GCT TTG TTC AAT CAA GGG TAT 
Asp Thr Ala Val Leu Ala Leu Phe Asn Gin Gly Tyr 

GGC ATA TTA GAG TTT CAT TTT GAT GAA AAA GCC AGA 
Gly He Leu Glu Phe His Phe Asp Glu Lys Ala Arg 

ACT GAA AAG GAA AAA GGC GAC TTA AAA TCC CAA ATG 
Thr Glu Lys Glu Lys Gly Asp Leu Lys Ser Gin Met 

CAA AAA TTA GAG CAT GCT AAA ACG GCT TTA AAA ACA 
Gin Lys Leu Glu His Ala Lys Thr Ala Leu Lys Thr 

GTG GTG GAG GTG CGC ACA GAA AAG GTC AGT GAG GGC 
Val Val Glu Val Arg Thr Glu Lys Val Ser Glu Gly 

GGG GAT AGT ATT TAT ATC AAA CAA TCC ATT TAT GAG 
Gly Asp Ser He Tyr He Lys Gin Ser He Tyr Glu 

GAA TCT TTG AGT GCG AAC AAG CAA AGA GAT TTC ATG 
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Gly 


TAC 
Tyr 


GAT 
Asp 


TTT 
Phe 


TCT 
ser 


ACC 
Thr 


CAT 
His 


GAC 
Asp 


GCT 
Ala 


AAG 
Lys 
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Leu 


CAT 
His 


GAC 
Asp 


ATT 
He 


TTA 
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He 
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Glu 
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He 
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Glu 


Ser 


Leu 


Ser 


Ala 


Asn 


Lys 


Gin 


Arg Asp 


Phe 


Met 


TTG 


CGT 


TTA 


GAT CAA 


TTA 


GAA 


TAC 


GAT TCT 


TTG 
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Leu 


Arg 
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Gin 


Leu 
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TTA 
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ATT 
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TTT TTG 
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Ser 
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TCA 
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Lys 
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Lys 
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He 


Gin 


Tyr Arg 


He 
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HPC 130 

ATG AAA AGA TTT GTT TTG TTT 
Met Lys Arg Phe Val Leu Phe 

CAA GAT TAC TTT TTT AGG GAT 
Gin Asp Tyr Phe Phe Arg Asp 

CTT TCC CAA ACA ATA CAG CCA 
Leu Ser Gin Thr He Gin Pro 



TTA TCA CTC ATG GGT GTT TGC 
Leu Ser Leu Met Gly Val Cys 

TTT AAA TCT AAA GAC TTG CCC 
Phe Lys Ser Lys Asp Leu Pro 

TGC GCG CAA CTT AAC GCA TCA 
Cys Ala Gin Leu Asn Ala Ser 



GTT TGC GTT CAA GCT TAC GCC GAG 
Val Cys Val Gin Ala Tyr Ala Glu 

CAA AAA CTC CAT CTT GAT AAA AAG 
Gin Lys Leu His Leu Asp Lys Lys 

AAA CAC TAC ACT GCT ACC G 
Lys His Tyr Thr Ala Thr 



HPC133 

ATG CAA AGT CTT AGT TGG CTG 
Met Gin Ser Leu Ser Trp Leu 

ATA ATG ACT TTA TTG CAA TGG 
He Met Thr Leu Leu Gin Trp 

CGT TGG CAT GGG ATT TAT TTT 
Arg Trp His Gly He Tyr Phe 

CCG TTT GTT TTT GAT TTC TTT 
Pro Phe Val Phe Asp Phe Phe 

AAC GAC AAA CCT TTA GTT TTC 
Asn Asp Lys Pro Leu Val Phe 

ATC TTG CAT GAA ATC TTA AAT 
He Leu His Glu He Leu Asn 

TTG TGT TTA TTT ATA TTC GTT 
Leu Cys Leu Phe He Phe Val 

TTA CAA ACC GCT AAA GAT AAA 
Leu Gin Thr Ala Lys Asp Lys 

TT 



AAT TTA GCG TTC CGT TGG CTC 
Asn Leu Ala Phe Arg Trp Leu 

TAT CAT TAC AGC GTG TTC AGG 
Tyr His Tyr Ser Val Phe Arg 

TTA TTG CCT TTA GGG GTG TTT 
Leu Leu Pro Leu Gly Val Phe 

TGC GGC GTT ATT CAA ATG CCC 
Cys Gly Val He Gin Met Pro 

ACG CCA AGG GTG AAG CGC TTT 
Thr Pro Arg Val Lys Arg Phe 

ACA GAA TTA GTC CCT TTG AAT 
Thr Glu Leu Val Pro Leu Asn 

TTA AGC GCT TCT TTA ATC TTT 
Leu Ser Ala Ser Leu He Phe 

ATC GCC TCT TTA AAG AAT TTA 
He Ala Ser Leu Lys Asn Leu 



TTT ATA ACA GGG CTT GGC TAT TAT 
Phe He Thr Gly Leu Gly Tyr Tyr 

ATT TTA ACT AAG CAT CAT AAA ATG 
He Leu Thr Lys His His Lys Met 

ATC CTA TCG TAT GCT TTC AAA ATG 
He Leu Ser Tyr Ala Phe Lys Met 

ATG CTT ATT ATC TGG GCC AAA CGC 
Met Leu He He Trp Ala Lys Arg 

TTT ATT TTC TTG TTA* CTC TTT TTA 
Phe He Phe Leu Leu Leu Phe Leu 

GGG ATT TCG CTC GCG CTT GGC TAT 
Gly He Ser Leu Ala Leu Gly Tyr 

GAA AAA GCC TTA TCC AAG CAG TAT 
Glu Lys Ala Leu Ser Lys Gin Tyr 

AAA GTC ATC GCC ATT ACC GGA AGC 
Lys Val He Ala He Thr Gly Ser 



HPC143 



ATG 
Met 


AAA 
Lys 


AAA 
Lys 


CTT 
Leu 


CTT 
Leu 


TAT ACC 
Tyr Thr 


ATA 

He 


CTC 
Leu 


GCA 
Ala 


CTT 
Leu 


CTT 
Leu 


TTA 
Leu 


ATC GGT 
He Gly 


CTT 
Leu 


TTA 
Leu 


ACA 
Thr 


ACC 
Thr 


TAT 
Tyr 


ATC 
He 


ATC 
He 


CTT 
Leu 


TTT 
Phe 


ACA 
Thr 


GAA 
Glu 


TGG 
Trp 


GGG AAC 
Gly Asn 


AAA 
Lys 


ATC 
He 


ATC 
He 


GCT 
Ala 


TCG 
Ser 


TAT 
Tyr 


ATA 
He 


GAG 
Glu 


AAA 
Lys 


AAA 
Lys 


ATC 
He 


AAC 
Asn 


CCG 
Pro 


AAC 
Asn 


GAG 
Glu 


CGC TAC 
Arg Tyr 


TTG 
Leu 


AGC 
Ser 


GTT 
val 


AAA 

Lys 


ACC 
Thr 


TTT 
Phe 


AAA 
Lys 


TTG 
Leu 


AGA 
Arg 


TTC 
Phe 


AAC 
Asn 


TCT 
Ser 


TTG 
Leu 


GAT 
Asp 


TTT 
Phe 


AAA 
Lys 


GCT 
Ala 


CAA 
Gin 


GCC 
Ala 


AAC 
Asn 


GAT GAT 
Asp Asp 


TCC 
Ser 


ACG 
Thr 


CTC 
Leu 


ATT 
He 


CTT 

Leu 


AAG 
Lys 


GGG GAT 
Gly Asp 


TTT 
Phe 


TCA 
Ser 


CTT 
Leu 


TTA 
Leu 


AAG 
Lys 


CAA 
Gin 


AGC 
Ser 


GTG 
Val 


GAT 
Asp 


TTG 
Leu 


AAT 
Asn 


TAC 
Tyr 


CAC 
His 


ATA 
He 


GAT 
Asp 


ATT 
He 


AAA 
Lys 


GAT 
Asp 


TTA CGC 
Leu Arg 


TCT 
Ser 


TTC 
Phe 


AAA GAA 
Lys Glu 


TGG 
Trp 


ATA 
He 


CCC 
Pro 


TAC 
Tyr 


CCT 
Pro 


TTA AGA 
Leu Arg 


GGG 
Gly 


GCT 
Ala 


ATT 
He 


ATT 
He 


ACT 
Thr 


TCT GGG 
Ser Gly 


AAT 
Asn 


ATC 
He 


AAA 
Lys 


GGG 
Gly 


CAT 

His 


AGA 
Arg 


AAA 
Lys 


GCC 
Ala 


CTT 
Leu 


GTG 
Val 


ATT 
He 


CAA GGC 
Gin Gly 


GTC 
Val 


TCT 
Ser 


AAT 
Asn 


GTC 
Val 


GCT 
Ala 
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Abbildung 15 

CAA TCC CAC ACT GCC TAC AAC GCC CTT TTA 
Gin Ser His Tnr Ala Tyr Asn Ala Leu Leu 

AAA GAC GCC AAT TTA GAA GAT TTG CTT TAT 
Lys Asp Ala Asn Leu Glu Asp Leu Leu Tyr 

TCC TTA CAA GCG GAT TTT AAC TCT CTA AAG 
Ser Leu Gin Ala Asp Phe Asn Ser Leu Lys 

GCT TTA ATC AAT AAC GCC CTA ATC AAT CAA 
Ala Leu lie Asn Asn Ala Leu lie Asn Gin 

AAC CTC TCG CAC TCA AGC GAC TTT AAA GAG 
Asn Leu Ser His Ser Ser Asp Phe Lys Glu 

TTA GCC AAT TTT ACA GCC CTA AAA AGC GAA 
Leu Ala Asn Phe Thr Ala Leu Lys Ser Glu 

ACT TTA GAA ATA CCC AAT CTG GCC AAA CTC 
Thr Leu Glu lie Pro Asn Leu Ala Lys Leu 

ACT TTA AAA GGC GCT ATA GAG CAA AGC CCC 
Thr Leu Lys Gly Ala lie Glu Gin Ser Pro 

GAT GGC ACG CTC GAT TTC ACG CTT TTA AAT 
Asp Gly Thr Leu Asp Phe Thr Leu Leu Asn 

TTA AAA GCC TTA GAT TTA TTC AAT TAC CCC 
Leu Lys Ala Leu Asp Leu Phe Asn Tyr Pro 

TAT GAC CTT AGC GCT AAG CAA GGC ACA TTG 
Tyr Asp Leu Ser Ala Lys Gin Gly Thr Leu 

GCA TTC AGC GAT TTC CTC TAC TCC ATT TCT 
Ala Phe Ser Asp Phe Leu Tyr Ser lie Ser 

AAT CTA GTA AGC CAA ATC AAC CAG CAA CGC 
Asn Leu Val Ser Gin lie Asn Gin Gin Arg 

CAA TTG AAA ATC CAT AAC GGG CTT GTG GAT 
Gin Leu Lys lie His Asn Gly Leu Val Asp 

GAA ATC TTA AAA TTC GTT TTT AAA ATG AAA 
Glu He Leu Lys Phe Val Phe Lys Met Lys 

ATT TTA AAC GAA AAA GCC ATC CAA CAA AAC 
He Leu Asn Glu Lys Ala He Gin Gin Asn 

ACC CTT AAA AAA GGT TTA GAT CAT TTG CTT 
Thr Leu Lys Lys Gly Leu Asp His Leu Leu 

CTT AAG GGG CTT TTT TAA 
Leu Lys Gly Leu Phe 
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GAT GAT TTC AAG CTT TCT CAC TTA AGC TTG AAC GCA 
Asp Asp Phe Lys Leu Ser His Leu Ser Leu Asn Ala 

TTA ATC AAT CGC CCC GCT TAT GCG AAC GCA AAA GTG 
Leu He Asn Arg Pro Ala Tyr Ala Asn Ala Lys Val 

CCT TTA GAA GGG CAT TTG ATT CTA ACA GCC AAT AAC 
Pro Leu Glu Gly His Leu He Leu Thr Ala Asn Asn 

ATG TTT CAT TTA AAC CTT AAA GAC ACG CTT ATC TTC 
Met Phe His Leu Asn Leu Lys Asp Thr Leu He Phe 

AAC AAA GCC ATC AGC GAT ACC ACC CTG ACT AGC CCT 
Asn Lys Ala He Ser Asp Thr Thr Leu Thr Ser Pro 

TAC CTT TTC TCT ATT TTA AAA CTC AAT GCC CCC TAC 
Tyr Leu Phe Ser He Leu Lys Leu Asn Ala Pro Tyr 

CAA AAC ATG ACT AAC CAC CCC CTA AAA GGG AGT TTG 
Gin Asn Met Thr Asn His Pro Leu Lys Gly Ser Leu 

AAA CTC TTA AAA GTC AGC GGC CAT TCA AAT TTA CTG 
Lys Leu Leu Lys Val Ser Gly His Ser Asn Leu Leu 

AAA GAT TTG AAA GCC CGT TTT TCA AAT ATT TCC ACT 
Lys Asp Leu Lys Ala Arg Phe Ser Asn He Ser Thr 

AAG TTT TTC CAA TCC ATT GCA GAC GCT AAC TTG GAT 
Lys Phe Phe Gin Ser He Ala Asp Ala Asn Leu Asp 

AAA GCC CGC CTA AAA AAC GCA AGA TTC CTC AAA AAT 
Lys Ala Arg Leu Lys Asn Ala Arg Phe Leu Lys Asn 

CAA TTT GAT ATT ACT AAA GAA ATC TAT AAC GAT GCC 
Gin Phe Asp He Thr Lys Glu He Tyr Asn Asp Ala 

CTG CTC TCT AGT CTC AGC TTA AAA AGC CCC AAA ACC 
Leu Leu Ser Ser Leu Ser Leu Lys Ser Pro Lys Thr 

TTA AAC ACC AAA CAA ATG GAC ATG CTC ATA GAT GCG 
Leu Asn Thr Lys Gin Met Asp Met Leu He Asp Ala 

CTT CAA GGC AAC ATA CAC CAG CCA AAA TTT TCC CTC 
Leu Gin Gly Asn He His Gin Pro Lys Phe Ser Leu 

CTG CAA CAA GGC TTG AAA GAA ATC CTA AAA AAC GAC 
Leu Gin Gin Gly Leu Lys Glu He Leu Lys Asn Asp 

AAA GAT GAT AAG CTC AAA GAA AAG CTT GAA AAA GGG 
Lys Asp Asp Lys Leu Lys Glu Lys Leu Glu Lys Gly 



HPC144 

ATG AAG AGA TCT TCT GTA TTT AGT TTC TTG GTA GCT TTT TTA TTG GTA ACT GGC TGT AGT CAT AAA 
Met Lys Arg Ser Ser Val Phe Ser Phe Leu Val Ala Phe Leu Leu Val Thr Gly Cys Ser His Lys 

ATG GAT AAT AAG ACT GTG GCC G 
Met Asp Asn Lys Thr Val Ala 



HPC152 

TTG AAA CAT TTG ACC CCA CTC ACT CAC ACC CTT TTT AAA GCC TTA TGG CTA GGC ACG GTC TTA AGC 
Met Lys His Leu Thr Pro Leu Thr His Thr Leu Phe Lys Ala Leu Trp Leu Gly Thr Val Leu Ser 

GCA TCT TTA AGC TTA GTT GCA GCA GAA AGC CCC ACT AGA ACA GAG CCT AAA CCC GCT AAG GGG GTT 
Ala Ser Leu Ser Leu Val Ala Ala Glu Ser Pro Thr Arg Thr Glu Pro Lys Pro Ala. Lys Gly Val 

AAA AAT AAA CCC AAA TCG CCC GTT ACT AAA GTC ATG ATG ACC AAT TGC GAC AAC CTT AAA GAC TTT 
Lys Asn Lys Pro Lys Ser Pro Val Thr Lys Val Met Met Thr Asn Cys Asp Asn Leu Lys Asp Phe 

AAC GCT AAT CAA AAA GAA GTT CTA AAA GCC GCC TAT CAA TTC GGC TCT AAA GAA AAT TTA GGC TAT 
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Abbildung 15 

Asn Ala Asn Gin Lys Glu Val 

GAA ATG GCA GGC ATT GCA TGG 
Glu Met Ala Gly He Ala Trp 

AGT GCG GGC GTG TAT CAT TCT 
Ser Ala Gly Val Tyr His Ser 

TTT TTG CGT AAT GTG ATG GGG 
Phe Leu Arg Asn Val Met Gly 

AAA GAG TTG CTC TAT TGG AAA 
Lys Glu Leu Leu Tyr Trp Lys 

AAG GGC AGT CGT TGG GAA AAA 
Lys Gly Ser Arg Trp Glu Lys 

CAA GAC AGG ATC AGG CGT TTG 
Gin Asp Arg He Arg Arg Leu 

TTG CAA AAA AGC GCT AAT AGC 
Leu Gin Lys Ser Ala Asn Ser 

GCC ACC CAA AAA TCT CAA ATA 
Ala Thr Gin Lys Ser Gin He 

ATG AAA GAG ACA ACT AGC GAG 
Met Lys Glu Thr Thr Ser Glu 

TTG GCT CAA ATC AAT AGC ACT 
Leu Ala Gin He Asn Ser Thr 

AGC CAA AAA CGC TCC TCT AAA 
Ser Gin Lys Arg Ser Ser Lys 

TCC AAA AAT AAA GAA ATG TGC 
Ser Lys Asn Lys Glu Met Cys 

ATC ACT CTC ATG CAA GAG CTT 
He Thr Leu Met Gin Glu Leu 
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Leu Lys Ala Ala Tyr Gin Phe 

AAA GAA TCA TGT GCA GGG GTT 
Lys Glu Ser Cys Ala Gly Val 

TAT ATC CCA AGC GTT CTA AAA 
Tyr He Pro Ser Val Leu Lys 

GAA TTG CTC ATT AAA GAC GAT 
Glu Leu Leu He Lys Asp Asp 

ACA CGC TAC CAT GAC AAT CTA 
Thr Arg Tyr His Asp Asn Leu 

AAC GAG AAG TCT AAC GCC GAA 
Asn Glu Lys Ser Asn Ala Glu 

AAA GAA TCT AAA ATC TTT GAT 
Lys Glu Ser Lys lie Phe Asp 

AAC CTG GAT TTA GAC CCT ATC 
Asn Leu Asp Leu Asp Pro He 

GAA AAA TCT CAA ATA GAG GAA 
Glu Lys Ser Gin lie Glu Glu 

CAA ATA ACC AAC AAG CCA GAA 
Gin He Thr Asn Lys Pro Glu 

GAT TTC ACA CCC GCT AAA AAA 
Asp Phe Thr Pro Ala Lys Lys 

AAT AAT ATC AGC GTT AAA AAC 
Asn Asn He Ser Val Lys Asn 

AAA AAT TGC TCT CCA GGG CAA 
Lys Asn Cys Ser Pro Gly Gin 

TAA 
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Gly Ser Lys Glu Asn Leu Gly Tyr 

TAT AAA ATC AAT TTT TCC GAT CCG 
Tyr Lys He Asn Phe Ser Asp Pro 

AGC TAT GGG CAT AAT GAT AGC CCC 
Ser Tyr Gly His Asn Asp Ser Pro 

GCG TTT GCT TCT GAA GTG GCT TTA 
Ala Phe Ala Ser Glu Val Ala Leu 

AAA GAC ATG ATT AAA TCT TAC AAC 
Lys Asp Met He Lys Ser Tyr Asn 

GCT GAA AAA TAT TAT GAA GAG ATA 
Ala Glu Lys Tyr Tyr Glu Glu He 

TCG CAG TCT AGT AAT GAC CAA GAA 
Ser Gin Ser Ser Asn Asp Gin Glu 

GGC AGC ACC ATG CCC CAA ACT TTA 
Gly Ser Thr Met Pro Gin Thr Leu 

ACC CAA GCA GAA AAA CCC CAA GAA 
Thr Gin Ala Glu Lys Pro Gin Glu 

AAA GCA AAA GAT AAA CCC ATG TAT 
Lys Ala Lys Asp Lys Pro Met Tyr 

CGC TCT CAA AAA CCG GCT AGA GTG 
Arg Ser Gin Lys Pro Ala Arg Val 

AAC ACC AAA ACC GCT TCC AAA AAT 
Asn Thr Lys Thr Ala Ser Lys Asn 

AGG AAT GCG ATT TTA GCT AAC CAC 
Arg Asn Ala He Leu Ala Asn His 



HPC155 

G ATC ATT ATC GTG CCG TTA CCG 
He He He Val Pro Leu Pro 

GTG TTG ATT ATT TTA ATC GGG 
Val Leu He He Leu He Gly 

TTA CTC ATT GTA ACC CTA TAC 
Leu Leu He Val Thr Leu Tyr 

GGC TAT AAA GGG CCT AGC ACG 
Gly Tyr Lys Gly Pro Ser Thr 

AAT TAT GTG ATT GGT GCG ATT 
Asn Tyr Val He Gly Ala He 

GGC TCT ACT AGG GTT ACT GAA 
Gly Ser Thr Arg Val Thr Glu 

GCG ATT GAT GCG GAT TTA AAT 
Ala He Asp Ala Asp Leu Asn 

CTA AGC CAA GAA GCG GAT TTT 
Leu Ser Gin Glu Ala Asp Phe 

ATC GCT TCT ATT ATC ATC ACG 
He Ala Ser He lie He Thr 

GAT ATG AGT TTG AGC TTT AGC 
Asp Met Ser Leu Ser Phe Ser 

CAA ATC CCT GCT TTA ATC ATT 



CCT TTT GTG TTG GAT TTT THA 
Pro Phe Val Leu Asp Phe ? 

CTT TAT ATT GAC AAG CCG ACT 
Leu Tyr He Asp Lys Pro Thr 

CGC TTG GCT TTA AAT GTC GCC 
Arg Leu Ala Leu Asn Val Ala 

GTG AGC GAT ATT ATC ACG GCG 
Val Ser Asp He He Thr Ala 

ATC TTT AGT ATT TTA GTG CTG 
He Phe Ser He Leu Val Leu 

GTG AGA GCG CGA TTC GCT CTA 
Val Arg Ala Arg Phe Ala Leu 

TCA GGG CTT ATT GAT GAT AAG 
Ser Gly Leu He Asp Asp Lys 

TAT GGC GCG ATG GAT GGC GCG 
Tyr Gly Ala Met Asp Gly Ala 

CTT ATC AAT ATC ATT GGA GGG 
Leu He Asn He He Gly Gly 

GCT AGC ACT TTC ACT ATC TTA 
Ala Ser Thr Phe Thr He Leu 

GCG ACA GCG ACC G 



CTC ACG ATT TCT ATT GCG CTA TCG 
Leu Thr He Ser He Ala Leu Ser 

GAT TTT AGC GCT TTC CCC ACT CTA 
Asp Phe Ser Ala Phe Pro Thr Leu 

ACC ACT AGA ATG ATT TTA ACG CAA 
Thr Thr Arg Met He Leu Thr Gin 

TTT GGG GAA TTT AGC GTG AGC GGG 
Phe Gly Glu Phe Ser Val Ser Gly 

GTG AAT CTA TTA GTG GTT ACT AAT 
Val Asn Leu Leu Val Val Thr Asn 

GAC GCT ATG CCA GGA AAG CAA ATG 
Asp Ala Met Pro Gly Lys Gin Met 

GAA GCC AAA AAA CGG CGC GCC GCT 
Glu Ala Lys Lys Arg Arg Ala Ala 

TCT AAA TTC GTC AAA GGC GAT GCG 
Ser Lys Phe Val Lys Gly Asp Ala 

TTT TTA GTG GGC GTG TTC CAA AGG 
Phe Leu Val Gly Val Phe Gin Arg 

ACC ATT GGC GAT GGG CTT GTA GGG 
Thr He Gly Asp Gly Leu Val Gly 
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Abbildung 15 

Gin lie Pro Ala Leu lie lie Ala Thr Ala Thr 
HPC165 

ATG AAA AAG TTT AAA AAG AAA CCA AAA AGT ATC AAA CGA TTG CAT CAA AAT CAA AAA ACA ATC TTA 
Met Lys Lys Phe Lys Lya Lys Pro Lys Ser He Lys Arg Leu His Gin Asn Gin Lys Thr He Leu 

AAG CGT CCT TTA TGG CTC GCA CCT TTA CTC ATC AGC GGG TTT GTT AGT GGG GTG TAT GCT GAT GGA 
Lys Arg Pro Leu Trp Leu Ala Pro Leu Leu He Ser Gly Phe Val Ser Gly Val Tyr Ala Asp Gly 

ACA GAC ATT TTG GGG CTT AGT TGG GGT GAA AAA AGC CAA AAG GTA TGC GTG CAT CAT CCA TGG TAT 
Thr Asp He Leu Gly Leu Ser Trp Gly Glu Lys Ser Gin Lys Val Cys Val His His Pro Trp Tyr 

GCT ATA TGG AGT TGC GAT AAA TGG GAG GAA AAA ACA CAA CAA TTC ACA GGA AAC CAA CTC ATC ACA 
Ala He Trp Ser Cys Asp Lys Trp Glu Glu Lys Thr Gin Gin Phe Thr Gly Asn Gin Leu He Thr 

AAA ACT TGG GCA GGG GGT AAT GCG GCT AAT TAC TAC CAC ACT CAA AAC AAC CAA AAT ATT ACA GCC 
Lys Thr Trp Ala Gly Gly Asn Ala Ala Asn Tyr Tyr His Thr Gin Asn Asn Gin Asn He Thr Ala 

AAT TTA AAA AAT GAT AAC GGC ACT TAT TTT TTA AGC GGT CTG TAT AAC TAC ACC 
Asn Leu Lys Asn Asp Asn Gly Thr Tyr Phe Leu Ser Gly Leu Tyr Asn Tyr Thr 

HPC183 

ATG TTA GTT ACT CGC TTT AAA AAA GCT TTG ATC TCT TAT TCT TTA GGT GCG CTC ATT GTT TCA TCG 
Met Leu Val Thr Arg Phe Lys Lys Ala Leu He Ser Tyr Ser Leu Gly Ala Leu He Val Ser Ser 

TTA TTG GGC GTG GCT AAC GCT TCA GCA CAA GAG GTT AAA GTC AAG GAT TAT TTC GGG GAG CAA ACT 
Leu Leu Gly Val Ala Asn Ala Ser Ala Gin Glu Val Lys Val Lys Asp Tyr Phe Gly Glu Gin Thr 

GTA AAG CTT CCT GTT TCT AAA ATA GCC TAT ATA GGG AGC TAT GTA GAA GTG CCT GCC ATG CTT AAT 
Val Lys Leu Pro Val Ser Lys He Ala Tyr He Gly Ser Tyr Val Glu Val Pro Ala Met Leu Asn 

GTT TGG AAT AGG GTT GTA GGC GTT TCG GAT TAC GCT TTT AAA GAT GAC ATT GTT AAA GCC ACT CTC 
Val Trp Asn Arg Val Val Gly Val Ser Asp Tyr Ala Phe Lys Asp Asp He Val Lys Ala Thr Leu 

AAA GGC GAA GAT CTT AAA CGC GTC AAA CAC ATG AGC ACT GAT CAT ACA GCC GCA CTA AAT GTA GAG 
Lys Gly Glu Asp Leu Lys Arg Val Lys His Met Ser Thr Asp His Thr Ala Ala Leu Asn Val Glu 

CTT TTA AAA AAG CTC AGC CCT GAT CTT GTG GTA ACC TTT GTG GGC AAC CCT AAA GCG GTA GAG CAT 
Leu Leu Lys Lys Leu Ser Pro Asp Leu Val Val Thr Phe Val Gly Asn Pro Lys Ala Val Glu His 

GCG AAA AAA TTT GGT ATA TCA TTT CTT TCT TTC CAA GAG ACA ACG ATC GCA GAG GCC ATG CAG GCT 
Ala Lys Lys Phe Gly He Ser Phe Leu Ser Phe Gin Glu Thr Thr He Ala Glu Ala Met Gin Ala 

ATG CAA GCT CAA GCT GCG GTC TTA GAA ATT GAC GCT TCT AAA AAA TTC GCC AAA ATG CAA GAA ACT 
Met Gin Ala Gin Ala Ala Val Leu Glu He Asp Ala Ser Lys Lys Phe Ala Lys Met Gin Glu Thr 

TTG GAT TTT ATC GCT GAG CGT TTG AAA GAT GTC AAA AAG AAA AAG GGG GTG GAG CTT TTC CAT AAA 
Leu Asp Phe He Ala Glu Arg Leu Lys Asp val Lys Lys Lys Lys Gly Val Glu Leu Phe His Lys 

GCC AAT AAA ATT AGC GGC CAT CAA GCC ATT AGC TCA GAC ATT TTA GAA AAA GGG GGC ATA GAC AAT 
Ala Asn Lys He Ser Gly His Gin Ala He Ser Ser Asp He Leu Glu Lys Gly Gly He Asp Asn 

TTT GGC TTG AAA TAC GTC AAA TTT GGG CGC GCT GAT ATT AGC GTG GAA AAA ATC GTT AAA GAA AAC 
Phe Gly Leu Lys Tyr Val Lys Phe Gly Arg Ala Asp He Ser Val Glu Lys He val Lys Glu Asn 

CCT GAA ATC ATT TTC ATC TGG TGG GTA AGC CCA CTC ACG CCT GAA GAT GTG TTA AAC AAC CCT AAG 
Pro Glu He He Phe He Trp Trp Val Ser Pro Leu Thr Pro Glu Asp Val Leu Asn Asn Pro Lys 

TTT TCC ACT ATT AAA GCC ATT AAA AAC AAG CAA GTT TAT AAA CTC CCC ACA ATG GAT ATT GGC GGG 
Phe Ser Thr He Lys Ala lie Lys Asn Lys Gin Val Tyr Lys Leu Pro Thr Met Asp He Gly Gly 

CCT AGA GCC CCA CTC ATA AGC TTA TTT ATC GCT TTA AAA GCC CAC CCT GAA GCC TTT AAG GGC GTG 
Pro Arg Ala Pro Leu He Ser Leu Phe He Ala Leu Lys Ala His Pro Glu Ala Phe Lys Gly Val 

GAT ATT AAT GCG ATT GTT AAA GAC TAC TAT AAA GTG GTT TTT GAT TTG AAC GAT GCA GAG GTT GAA 
Asp He Asn Ala He Val Lys Asp Tyr Tyr Lys Val Val Phe Asp Leu Asn Asp Ala Glu Val Glu 

CCC TTT TTA TGG CAT TAA 
Pro Phe Leu Trp His 



HPC186 

ATG GGC GGA TTC ACA AGC ATA TGG CAT TGG GTC ATT GTT TTA TTA GTG ATT GTG TTG TTG TTT GGG 
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Abbildung 15 

Met Gly Gly Phe Thr Ser lie Trp His Trp Val 

GCT AAA AAG ATC CCA GAA TTG GCT AAG GGT TTA 
Ala Lys Lys He Pro Glu Leu Ala Lys Gly Leu 

AAA GAC GAT GAA GAA GAG GCT AAA AAC GAG CCA 
Lys Asp A3p Glu Glu Glu Ala Lys Asn Glu Pro 

GTG CAT GAG AGT AGC GAG ATT AAA AGC AAA CAA 
Val His Glu Ser Ser Glu He Lys Ser Lys Gin 
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He Val Leu Leu Val He Val Leu Leu Phe Gly 

GGC AGT GGG ATT AAG AAT TTC AAA AAA GCC GTG 

Gly Ser Gly He Lys Asn Phe Lys Lys Ala Val 

AAA ACC CTA GAC GCT CAA GCA ACG CAA ACC AAA 

Lys Thr Leu Asp Ala Gin Ala Thr Gin Thr Lys 

GAA AGT TAA 
Glu Ser 



HPC188 

ATG AAA AAC TTT TCC CCA CTT TGT TGT TTT AAA AAG CTC AAA AAA CGC CAT TTA ATC GCT TTG AGC 
Met Lys Asn Phe Ser Pro Leu Cys Cys Phe Lys Lys Leu Lys Lys Arg His Leu He Ala Leu Ser 

CTG CCC TTG CTT TCT TAT GCC AAT GGC TTT AAA ATC CAA GAG CAA AGC CTA AAT GGC ACG GCT TTA 
Leu Pro Leu Leu Ser Tyr Ala Asn Gly Phe Lys He Gin Glu Gin Ser Leu Asn Gly Thr Ala Leu 

GGC TCG GCG TAT GTC GCT GGG GCT AGG GGT GCT GAT GCT TCC TTT TAT AAC CCG GCG AAT ATG GGC 
Gly Ser Ala Tyr Val Ala Gly Ala Arg Gly Ala Asp Ala Ser Phe Tyr Asn Pro Ala Asn Met Gly 

TTT ACT AAC GAT TGG GGT GAA AAC AGA AGC GAA TTT GAA ATG ACC ACC ACC GTG ATT AAC ATT CCG 
Phe Thr Asn Asp Trp Gly Glu Asn Arg Ser Glu Phe Glu Met Thr Thr Thr Val He Asn He Pro 

HPC190 

TTG GAA TTG AAA AAA ATC GCC CTT ATT TTA GAT GGC ATT GTA GCA AAA AAT TTT TTA GAC TTG GTG 
Met Glu Leu Lys Lys He Ala Leu He Leu Asp Gly lie Val Ala Lys Asn Phe Leu Asp Leu Val 

CTA AGG CAT TAT TCT AAT CAT AAT TTT TAT ATA GTG GTT GTC AAA AAT GAG AGC CTT ATC CCT AAA 
Leu Arg His Tyr Ser Asn His Asn Phe Tyr lie Val Val Val Lys Asn Glu Ser Leu lie Pro Lys 

AAT TAC CCG AGC ACT TTC GCT TTT TAT TGT TTT GAT GCG ACT TCT AGT TTC AGG CTT TTG CAA GTG 
Asn Tyr Pro Ser Thr Phe Ala Phe Tyr Cys Phe Asp Ala Thr Ser Ser Phe Arg Leu Leu Gin Val 

TTA AAC GAT GAG GTG AGC GAT GCG TTT TTA ATC ATA CAA GAT TTT AAA GAA CAG CGC ATC ATT CAT 
Leu Asn Asp Glu Val Ser Asp Ala Phe Leu lie lie Gin Asp Phe Lys Glu Gin Arg lie lie His 

AAA ATC ATT CAA ACC CAT TTC AAA CGC ATG CGC GTG GTT TTG AGC GTG AAA AAA GAT GGT GAA AAA 
Lys He lie Gin Thr His Phe Lys Arg Met Arg Val Val Leu Ser Val Lys Lys Asp Gly Glu Lys 

ACT TTA GAA AAT AAT GAA GAA AAT AAA GAT GAA AAG CTT ATT TTG ATT GAT GAA TTT GAA GTT TTA 
Thr Leu Glu Asn Asn Glu Glu Asn Lys Asp Glu Lys Leu lie Leu lie Asp Glu Phe Glu Val Leu 

GCC AAT AAA TTC ATT TCT CGT TTG CCT AAT ATC CCT AGC ACC CCT AGA GAA TTT GGG TTA GGC AAA 
Ala Asn Lys Phe lie Ser Arg Leu Pro Asn lie Pro Ser Thr Pro Arg Glu Phe Gly Leu Gly Lys 

GGC GAG ATC ATG GAG ATT GAT GTG CCT TTT GGG AGT ATT TTT GCT TAC AGG CAT ATT GGC TCT ATC 
Gly Glu lie Met Glu lie Asp Val Pro Phe Gly Ser lie Phe Ala Tyr Arg His He Gly Ser He 

AGG CAA AAA GAA TAC AGG ATT GTA GGG CTT TAT CGC AAC GAT GTT TTG TTG CTC TCC ACT AAA TCT 
Arg Gin Lys Glu Tyr Arg lie Val Gly Leu Tyr Arg Asn Asp Val Leu Leu Leu Ser Thr Lys Ser 

TTA GTT ATC CAG CCA CGA GAC ATT CTT TTA GTG GCG GGT AAT CCG GAA ATT TTA AAC GCG GTG TAT 
Leu Val lie Gin Pro Arg Asp lie Leu Leu Val Ala Gly Asn Pro Glu lie Leu Asn Ala Val Tyr 

CTT CAG GTC AAA AGC AAT GTC GGG CAG TTC CCA GCC CCC TTT GGT AAG AGC ATT TAT TTA TAC ATT 
Leu Gin Val Lys Ser Asn Val Gly Gin Phe Pro Ala Pro Phe Gly Lys Ser lie Tyr Leu Tyr lie 

GAT ATG CGC TTA CAA AGC CGA AAA GCA ATG ATG CGC GAT GTG TAT CAA GCC TTG TTT TTG CAC AAA 
Asp Met Arg Leu Gin Ser Arg Lys Ala Met Met Arg Asp Val Tyr Gin Ala Leu Phe Leu His Lys 

CAT TTA AAG AGC TAC AAG CTC TAC ATT CAG GTT TTA CAC CCC ACT AGC CCT AAG TTT TAC CAT AAA 
His Leu Lys Ser Tyr Lys Leu Tyr lie Gin Val Leu His Pro Thr Ser Pro Lys Phe Tyr His Lys 

TTT TTA TCG CTA GAA ACC GAA AGC ATT GAA GTG AAT TTT GAT TTT TAT GGG AAA AGT TTT ATC CAA 
Phe Leu Ser Leu Glu Thr Glu Ser lie Glu Val Asn Phe Asp Phe Tyr Gly Lys Ser Phe lie Gin 

AAA CTC CAT GAA GAC CAC CAG AAA AAA ATG GGT TTG ATT GTG GTA GGC AGA GAG CTT TTT TTA TCT 
Lys Leu His Glu Asp His Gin Lys Lys Met Gly Leu lie Val Val Gly Arg Glu Leu Phe Leu Ser 

AAA AAA CAC CGA AAA GCC CTA TAT AAA ACA GCC ACC CCG GTT TAT AAA ACC AAC ACT TCC GGC TTG 
Lys Lys His Arg Lys Ala Leu Tyr Lys Thr Ala Thr Pro Val Tyr Lys Thr Asn Thr Ser Gly Leu 
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Abbildung 15 

TCT AAA ACC TCT CAA AGC GTG GTG GTG TTG 
Ser Lys Thr Ser Gin Ser Val Val Val Leu 

GTG ATC TTT GAT GTG TCT ATG CAA ATG GAT 
Val lie Phe Asp Val Ser Met Gin Met Asp 

CGC TAT AAA AAC GAG ATT GTC AAT CAT TAT 
Arg Tyr Lys Asn Glu lie Val Asn His Tyr 

ATT TTT CAA ACC GAT ATT AGA AAT CCT ATC 
He Phe Gin Thr Asp lie Arg Asn Pro He 

TTC ATG CCT TTT GAA GAG TGC ATC ACG CAC 
Phe Met Pro Phe Glu Glu Cys He Thr His 

AAA TTA GCG TTT TTA AAC GAT GAT AAC CCT 
Lys Leu Ala Phe Leu Asn Asp Asp Asn Pro 
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AAT GAA AGC TTG GAT ATC AAT GAG GAC ATG TCT TCA 
Asn Glu Ser Leu Asp He Asn Glu Asp Met Ser Ser 

TTG GGC TTG TTG CTC TAT GAT TTT GAC CCT AAC AAG 
Leu Gly Leu Leu Leu Tyr Asp Phe Asp Pro Asn Lys 

GAA AAT TTA GCC AAC ACG CTC AAC CGC AAG ATT GAG 
Glu Asn Leu Ala Asn Thr Leu Asn Arg Lys He Glu 

ATG TAT CTC AAT TCT TTA AGA AAT CCC ATT TTG CAT 
Met Tyr Leu Asn Ser Leu Arg Asn Pro He Leu His 

ACG CGC TTT TGG TGG TTT TTA TCC ACT AAA GTG GAA 
Thr Arg Phe Trp Trp Phe Leu Ser Thr Lys Val Glu 

CAA ATT TTT ATC CCT GTA GCG GAG TGA 
Gin He Phe He Pro Val Ala Glu 



HPN013 

ATG AAA GCG TTG AAG ACT TTT TTA AAA AAA 
Met Lys Ala Leu Lys Thr Phe Leu Lys Lys 

TTA AAC GCT GTG GCT ATG ATT GTG GAT AAT 
Leu Asn Ala Val Ala Met He Val Asp Asn 

TGG GAT GAA AGC AAG TGG GCT AAA CAT TTA 
Trp Asp Glu Ser Lys Trp Ala Lys His Leu 

ACA TTA GAT AGG GCT AAT CAG ACG CTT AAT 
Thr Leu Asp Arg Ala Asn Gin Thr Leu Asn 

AAT CAA TTT CTA ACA GGC AGT ATT TTA AGC 
Asn Gin Phe Leu Thr Gly Ser He Leu Ser 

AGT TTT GCC AAG CAA GTT CAA GCC AAT ACT 
Ser Phe Ala Lys Gin Val Gin Ala Asn Thr 

CGC AAT CAA ATT GCA GCC AAA CGC ATC TCT 
Arg Asn Gin He Ala Ala Lys Arg lie Ser 

GAC GCG AGC CCT ACA GAG AAA AAC TTA CAC 
Asp Ala Ser Pro Thr Glu Lys Asn Leu His 

ACA AAG GCT CTA AAG GAT TTT GCT AAC GCC 
Thr Lys Ala Leu Lys Asp Phe Ala Asn Ala 

GGA GCT GGA CTT AGA GGC AGA GCC TTA TTA 
Gly Ala Gly Leu Arg Gly Arg Ala Leu Leu 

GCT AAA AAA ATC CAA TTA TTA GAC AGC CAA 
Ala Lys Lys He Gin Leu Leu Asp Ser Gin 

TAT GAA AAA CTT AGA GCT GAA AAA GAA GAA 
Tyr Glu Lys Leu Arg Ala Glu Lys Glu Glu 

GTC AAA CAG CTT GTT GTA GCT TCC CAA GAT 
Val Lys Gin Leu Val Val Ala Ser Gin Asp 

AAA ACT TTT GGG TTC AAC GAT GAG AAT GTT 
Lys Thr Phe Gly Phe Asn Asp Glu Asn Val 

AAA AGC GAG TGC ATC CCT AAC ATG CTC AAT 
Lys Ser Glu Cys He Pro Asn Met Leu Asn 

TTA GAT TAT AGT AGG GAT ATT GCT GGT AAA 
Leu Asp Tyr Ser Arg Asp He Ala Gly Lys 

AAA CAC CGA TTC CAA CAA TTA AGC GTA GAA 
Lys His Arg Phe Gin Gin Leu Ser Val Glu 

AAT AAG ACG CTA GGT TTA ATG GTG CAA ATG 
Asn Lys Thr Leu Gly Leu Met Val Gin Met 



TCC CTT ATT CTG TTA CTA GCA ATT GCC TTA AAC CAC 
Ser Leu He Leu Leu Leu Ala He Ala Leu Asn His 

CCT ACG CAG AAC GCT TGG AAT GGT GCT AAA AGA GCA 
Pro Thr Gin Asn Ala Trp Asn Gly Ala Lys Arg Ala 

GCC ACT ATT ACT GAA AGG ATC AAG CTC GCT CAA GAC 
Ala Thr He Thr Glu Arg He Lys Leu Ala Gin Asp 

TCC ATC AAC AAA GTG AAT GAT GTT TTG AAC AAA ACC 
Ser He Asn Lys Val Asn Asp Val Leu Asn Lys Thr 

ATC CCC AAT CCC ATG CAG TAT GTA GAA AAA ATC CAA 
He Pro Asn Pro Met Gin Tyr Val Glu Lys He Gin 

GAA AGG ATC AAA GAA AAT GCA CAA AAC TAT GAT ATA 
Glu Arg He Lys Glu Asn Ala Gin Asn Tyr Asp He 

GAA AAA TGC CCT GAA CTC AAT TGG GAT GTC AGT CAA 
Glu Lys Cys Pro Glu Leu Asn Trp Asp Val Ser Gin 

CAA TTT TTC ACG AGC AAG GGG AAA GAA AGC GCT AAC 
Gin Phe Phe Thr Ser Lys Gly Lys Glu Ser Ala Asn 

ATA GGT AAC ACT CAA ATC AGC ACG GCG AAC GAT TTA 
He Gly Asn Thr Gin He Ser Thr Ala Asn Asp Leu 

GAA TAC ATT TGC ATT CAA AAA GGC AAT TTA GAA GCG 
Glu Tyr He Cys He Gin Lys Gly Asn Leu Glu Ala 

ATG ACT TTA GCT CTA CTC AAT AAC GAC TAT ACG GCT 
Met Thr Leu Ala Leu Leu Asn Asn Asp Tyr Thr Ala 

TTA AAA AGA CAA ATC GCT TCA AAT GTG TAT GCG AAA 
Leu Lys Arg Gin He Ala Ser Asn Val Tyr Ala Lys 

AGA GCG TTT AGT CAA ATG GAT AAT GAG TTG GGC GTT 
Arg Ala Phe Ser Gin Met Asp Asn Glu Leu Gly Val 

AAA AAA GGT TAT TGC AAG AAA GAA AAC AGA AAT GGC 
Lys Lys Gly Tyr Cys Lys Lys Glu Asn Arg Asn Gly 

GTT AAT CGC TTA AAA GCG CAA TTT GAT GAG CTT AAT 
Val Asn Arg Leu Lys Ala Gin Phe Asp Glu Leu Asn 

AAA GGT GAA GCA GCC GCT AAA GTG TTC AAT GAC TAC 
Lys Gly Glu Ala Ala Ala Lys Val Phe Asn Asp Tyr 

ACT GCT TTA GAA ATC GCT CAA AAT TTA AGT TTT ATG 
Thr Ala Leu Glu He Ala Gin Asn Leu Ser Phe Met 

CAA AGC TAT GCA TTC AAG CAA CAA ATG GGC TAT TTT 
Gin Ser Tyr Ala Phe Lys Gin Gin Met Gly Tyr Phe 
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Abbildung 15 

GAA GAT ATT ATT CCT GCT GAC 
Glu Asp lie He Pro Ala Asp 

CAA CAA GAA ATA GAG AAA GTC 
Gin Gin Glu He Glu Lys Val 

GGA AAG GCA AGT GGC GTG AAT 
Gly Lys Ala Ser Gly Val Asn 

TTT AAT CCG TAT TGA 
Phe Asn Pro Tyr 
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GCC CTA AAA GAT GAC AAA GAG 
Ala Leu Lys Asp Asp Lya Glu 

TAT AGG GCT AAA TTA GAC GCT 
Tyr Arg Ala Lys Leu Asp Ala 

TCA AAT AGT AAT AAT GAA GCC 
Ser Asn Ser Asn Asn Glu Ala 



CAT CAA GAA AAT CTT GAA CAA AAA 
His Gin Glu Asn Leu Glu Gin Lys 

TAT GGT TTC CCT AAT GGT AGT GTA 
Tyr Gly Phe Pro Asn Gly Ser Val 

CCA AGC TCT GAT AAT ATC CAG TCG 
Pro Ser Ser Asp Asn He Gin Ser 



HPN048 

GTG CAA CCG ATG AAA TCT AAA AAA CTT TAT TTG 
Met Gin Pro Met Lys Ser Lys Lys Leu Tyr Leu 

ACC CTA TCT TCA TGG CTG GGT AAT AGC GGT TTA 
Thr Leu Ser Ser Trp Leu Gly Asn Ser Gly Leu 

AAT AAA AAA TAT TTT GGG CAT CTT TCA TTC ATT 
Asn Lys Lys Tyr Phe Gly His Leu Ser Phe He 

TTA TAC AAG ACT AAA AAC CCT TTT ACA GAA ATC 
Leu Tyr Lys Thr Lys Asn Pro Phe Thr Glu He 

ATT TTA TCT TTG CTC TTT TTA CAA TCT AGC CTA 
He Leu Ser Leu Leu Phe Leu Gin Ser Ser Leu 

TTG TTT TTA CGC CCT TTT ATA GGG GAT TTT GGG 
Leu Phe Leu Arg Pro Phe He Gly Asp Phe Gly 

TCT TAT TTG ATT CTA TTC AAA CTA CCC CCT AAA 
Ser Tyr Leu He Leu Phe Lys Leu Pro Pro Lys 

AAC CTT TTA AAA GAG ATT TAC AAA CAA TGC TTA 
Asn Leu Leu Lys Glu He Tyr Lys Gin Cys Leu 

GAG GGT TTT GAA AAC ACC CCA TCA GAT ATT CAA 
Glu Gly Phe Glu Asn Thr Pro Ser Asp He Gin 

AAC CGC AAA GAA AAC CCT ATT AAT GAA AAC CAC 
Asn Arg Lys Glu Asn Pro He Asn Glu Asn His 

CCT ACC CCC TAT AAC ACG ACT TTA AAT GAT TCA 
Pro Thr Pro Tyr Asn Thr Thr Leu Asn Asp Ser 

CAC CCC CCT ACC CAT TAC ACC ATT TAC CCT AAA 
His Pro Pro Thr His Tyr Thr He Tyr Pro Lys 

AAC CCC CCT TTA AAA GAA ATT AAA CAA GAA ACT 
Asn Pro Pro Leu Lys Glu He Lys Gin Glu Thr 

CTT ACG CCC ACC ACG CCC AAA CCT ATC ATG CCC 
Leu Thr Pro Thr Thr Pro Lys Pro He Met Pro 

ACA GAA AAC CAA AAA ACC CCC AAC CAC CCT AAA 
Thr Glu Asn Gin Lys Thr Pro Asn His Pro Lys 

GAA ATG ATA GAA GGA AGG ATA GAA GAA ATG ATA 
Glu Met He Glu Gly Arg He Glu Glu Met He 

CAA AAC GCT CCA AAC TTT AGC CCA GTA ACC CCC 
Gin Asn Ala Pro Asn Phe Ser Pro Val Thr Pro 

TTG AGC GAA AAT AAA GAG ATA TTA GAC GGA TTG 
Leu Ser Glu Asn Lys Glu He Leu Asp Gly Leu 

GAG CTT CCC ACC ACG CAA TTA TTG AAT GCG GTT 
Glu Leu Pro Thr Thr Gin Leu Leu Asn Ala Val 

ATT GAC CAA AAA ATC CAG GAT CTA TTG AGC AAA 
He Asp Gin Lys He Gin Asp Leu Leu Ser Lys 



GCT TTA ATC ATA GGG GTT TTA TTA GCG TTT TTA 
Ala Leu He He Gly Val Leu Leu Ala Phe Leu 

GTG GGG CGT TTT GGG GTG TGG TTT GCC GCA CTC 
Val Gly Arg Phe Gly Val Trp Phe Ala Ala Leu 

AAT TTA CCC TAT TTA GCA TGG GTT TTA TTC CTT 
Asn Leu Pro Tyr Leu Ala Trp Val Leu Phe Leu 

GTT TTA GAA AAA ACT TTA GGG CAT CTA TTA GGC 
Val Leu Glu Lys Thr Leu Gly His Leu Leu Gly 

TTA AAT CAA GGG GAA ATC GGC AAC AGC GCG CGT 
Leu Asn Gin Gly Glu He Gly Asn Ser Ala Arg 

CTT TAT GCG CTG ATA ACG CTT ATG GTA GTT ATT 
Leu Tyr Ala Leu He Thr Leu Met Val Val He 

AGC GTT TTT TAT CCT TAT ATG AAC AAA ACA CAA 
Ser Val Phe Tyr Pro Tyr Met Asn Lys Thr Gin 

CAA GCC TTT AGC CCT AAT TTT AGC CCA AAA AAA 
Gin Ala Phe Ser Pro Asn Phe Ser Pro Lys Lys * 

AAA AAA GAA ACC AAA AAC GAC AAA GAA AAA GAA 
Lys Lys Glu Thr Lya Asn Asp Lys Glu Lys Glu 

AAA ACC CCT AAC GAA GAA CCG TTT TTA GCG ATC 
Lys Thr Pro Asn Glu Glu Pro Phe Leu Ala He 

GAG CCG CAA GAA GGC TTA GTC CAA ATT TCC TCC 
Glu Pro Gin Glu Gly Leu Val Gin He Ser Ser 

AGA AAC CGA TTT GAT GAT TTG ACT AAC CCC ACT 
Arg Asn Arg Phe Asp Asp Leu Thr Asn Pro Thr 

AAA GAA AGA GAA CCC ACG CCT ACA AAA GAA ACT 
Lys Glu Arg Glu Pro Thr Pro Thr Lys Glu Thr 

ACA CTT GCA CCC ATA ATA GAA AAT GAC AAC AAA 
Thr Leu Ala Pro He He Glu Asn Asp Asn Lys 

AAA GAA GAA AAC CCA CAA GAA AAC ACG CAA GAA 
Lys Glu Glu Asn Pro Gin Glu Asn Thr Gin Glu 

AAG GAA AAT CTA AAA AAA GAA GAA AAA GAA GTG 
Lys Glu Asn Leu Lys Lys Glu Glu Lys Glu Val 

ACA AGC GCT AAA AAA CCC GTT ATG GTT AAA GAA 
Thr Ser Ala Lys Lys Pro Val Met Val Lys Glu 

GAT TAT GGC GAA GTG CAA AAA CCC AAA GAT TAT 
Asp Tyr Gly Glu Val Gin Lys Pro Lys Asp Tyr 

TGT TTG AAA GAC ACT TCT TTA GAC GAA AAC GAG 
Cys Leu Lys Asp Thr Ser Leu Asp Glu Asn Glu 

CTG CGC ACC TTT AAA ATT GAT GGC GAT ATT ATC 
Leu Arg Thr Phe Lys He Asp Gly Asp He He 
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CGC ACT TAT TCA GGC CCT ATT GTA ACC ACT 
Arg Thr Tyr Ser Gly Pro lie Val Thr Thr 

CGT ATT TTA GGC TTG AGC GAT GAT TTA GCG 
Arg lie Leu Gly Leu Ser Asp Asp Leu Ala 

CCT ATT AAG GGT AAA GAT GTC GTT GGC ATT 
Pro lie Lys Gly Lys Asp Val Val Gly lie 

AGA GAA ATT CTA GAG AGC GAA TTG TTT CAA 
Arg Glu lie Leu Glu Ser Glu Leu Phe Gin 

GAC ATT GTG GGT AAC CCT TTC ATC ACG GAT 
Asp lie val Gly Asn Pro Phe lie Thr Asp 
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TTT GAA TTC CGC CCA GCC CCT AAC GTT AAG GTG AGT 
Phe Glu Phe Arg Pro Ala Pro Asn Val Lys Val Ser 

ATG ACT TTA TGC GCT GAA TCC ATC CGC ATT CAA GCC 
Met Thr Leu Cys Ala Glu Ser lie Arg lie Gin Ala 

GAA ATC CCT AAC AGC CAA AGC CAA ATT ATT TAT TTA 
Glu lie Pro Asn Ser Gin Ser Gin lie lie Tyr Leu 

AAA TCC AGC TCG CCC TTA ACT CTA GCT TTA GGC AAA 
Lys Ser Ser Ser Pro Leu Thr Leu Ala Leu Gly Lys 

TTA AAA AAG CTC CCC CAT TTG CTC ATC GCT GGC ACG 
Leu Lys Lys Leu Pro His Leu Leu lie Ala Gly Thr 



ACA GGA AGC GGT AAG AGC GTG GGC GTG AAT GCG 
Thr Gly Ser Gly Lys Ser Val Gly Val Asn Ala 

GAT CAA CTC AAA TTA GTG ATG ATC GAT CCC AAA 
Asp Gin Leu Lys Leu Val Met lie Asp Pro Lys 

CAT TTG CTC ACG CCC ATT ATC ACC GAC CCT AAA 
His Leu Leu Thr Pro lie lie Thr Asp Pro Lys 

GAA ATG GAA CGC CGG TAT TCT TTA ATG AGC GAA 
Glu Met Glu Arg Arg Tyr Ser Leu Met Ser Glu 

CAA GCC CCA AGT AAC GGC GTT GAA GCG TTC CCC 
Gin Ala Pro Ser Asn Gly Val Glu Ala Phe Pro 

TTA ATG ATG ACA GGG GGC AAA GAA GCG GAG TTT 
Leu Met Met Thr Gly Gly Lys Glu Ala Glu Phe 

AGC GGC TTA CAC CTC ATT GTA GCG ACC CAA CGC 
Ser Gly Leu His Leu lie Val Ala Thr Gin Arg 

ACC AAC TTG CCT TCA AGG GTG AGT TTT AGG GTA 
Thr Asn Leu Pro Ser Arg Val Ser Phe Arg Val 

ACT GAT GGG GCG CAA AGC TTG TTA GGA AGA GGC 
Thr Asp Gly Ala Gin Ser Leu Leu Gly Arg Gly 

TTA GTG CGC TTG CAT GCC CCC TTT GCC ACT GAA 
Leu Val Arg Leu His Ala Pro Phe Ala Thr Glu 

GCC CAA AAA GAA GTA CAA TAC GAT AAA GAT TTC 
Ala Gin Lys Glu Val Gin Tyr Asp Lys Asp Phe 

CCT AAT TAT CAA GGC GAT GAC ATT TTA GAA AGG 
Pro Asn Tyr Gin Gly Asp Asp He Leu Glu Arg 

TCT ACG AGT TTT TTA CAA CGG CAA TTA AAA ATC 
Ser Thr Ser Phe Leu Gin Arg Gin Leu Lys He 

TTA GAA GCT CAA GGC TTT TTA TCC CCA AGA AAC 
Leu Glu Ala Gin Gly Phe Leu Ser Pro Arg Asn 

TAA 



ATG ATT TTA TCC TTA CTT TAT AAA AAC CCT CCC 
Met He Leu Ser Leu Leu Tyr Lys Asn Pro Pro 

ATG GTA GAA TTT AGT ATT TAT GCG GAT ATC CCT 
Met Val Glu Phe Ser He Tyr Ala Asp He Pro 

AAA GCT ATT GGG GCT TTG CAA AGC GTG GCT AAA 
Lys Ala He Gly Ala Leu Gin Ser Val Ala Lys 

TAC AAG GTT AAA ACC ATT GAT TCT TAT AAT GAA 
Tyr Lys Val Lys Thr He Asp Ser Tyr Asn Glu 

TAT TTG ATT GTG GTG ATT GAT GAA TTA GCG GAT 
Tyr Leu He Val Val He Asp Glu Leu Ala Asp 

CCT ATC GCT AGA ATC GCT CAA ATG GGG CGC GCG 
Pro He Ala Arg He Ala Gin Met Gly Arg Ala 

CCA AGC GTG GAT GTC GTA ACC GGC TTG ATT AAA 
Pro Ser Val Asp Val Val Thr Gly Leu He Lys 

GGC ACT AAG ATT GAT TCT AAA GTG ATT TTA GAC 
Gly Thr Lys He Asp Ser Lys Val He Leu Asp 

GAT ATG CTC TTT ACC CCC CCA GGA GCG AAC GGG 
Asp Met Leu Phe Thr Pro Pro Gly Ala Asn Gly 

GAT GAA ATC AAA AAA ATC GTG GAT TTT ATT AAA 
Asp Glu He Lys Lys He Val Asp Phe He Lys 

TTG CTA GAA GAA TCA CGC ATG CCT TTA GAC ACC 
Leu Leu Glu Glu Ser Arg Met Pro Leu Asp Thr 

GCT AAA GCG GTG ATT TTA GAA AAA AAG ATC ACT 
Ala Lys Ala Val He Leu Glu Lys Lys He Thr 

GGC TAC AAC CAA GCC GCT ACC ATT ACT GAC GAA 
Gly Tyr Asn Gin Ala Ala Thr He Thr Asp Glu 

GCT AAA GGC AAC AGA GAG ATT TTG CAA AAC TTT 
Ala Lys Gly Asn Arg Glu He Leu Gin Asn Phe 
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ATG GGT AAT CAT TTT TCT AAA TTA GGA TTT 
Met Gly Asn His Phe Ser Lys Leu Gly Phe 

CAT ATC TGG CGT TTC CCC TAC ATG ACT GGG 
His He Trp Arg Phe Pro Tyr Met Thr Gly 

TTT TTA TCT TTA AGC GTT GGC GCG GCG ATG 
Phe Leu Ser Leu Ser Val Gly Ala Ala Met 

AAA AAT GTA ACA GAA GCT TTT AAA GAG CTT 
Lys Asn Val Thr Glu Ala Phe Lys Glu Leu 



GTT TTA GCC GCA TTA GGA AGC GCG ATA GGT TTA GGG 
Val Leu Ala Ala Leu Gly Ser Ala He Gly Leu Gly 

GTG AGT GGT GGG GGT GCT TTT GTT TTA TTG TTT TTA 
Val Ser Gly Gly Gly Ala Phe Val Leu Leu Phe Leu 

TTT ATC GCT GAA ATG CTA TTA GGA CAA AGC ACT CAA 
Phe He Ala Glu Met Leu Leu Gly Gin Ser Thr Gin 

GAC ATT AAC CCC AAA AAA CGC TGG AAA TAC GCA GGG 
Asp He Asn Pro Lys Lys Arg Trp Lys Tyr Ala Gly 
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CTT TTG CTT GTT TCT GGG CCA TTA ATA CTG ACT TTT TAC GGC ACG ATT TTA GGT TGG GTG CTT TAT 
Leu Leu Leu Val Ser Gly Pro Leu lie Leu Thr Phe Tyr Gly Thr lie Leu Gly Trp Val Leu Tyr 

TAT TTG GTG AGT GTT AGT TTT AAT TTG CCT AAC AAT ATC CAA GAA TCT GAA CAA ATT TTT ACT CAA 
Tyr Leu Val Ser Val Ser Phe Asn Leu Pro Asn Asn lie Gin Glu Ser Glu Gin He Phe Thr Gin 

ACT TTG CAG TCT ATA GGG CTA CAA TCC ATA GGG CTT TTT AGC GTT TTA TTG ATA ACC GGA TGG ATT 
Thr Leu Gin Ser He Gly Leu Gin Ser He Gly Leu Phe Ser Val Leu Leu He Thr Gly Trp He 

GTT TCT AGG GGG ATT AAA GAA GGC ATT GAA AAG CTC AAT TTG GTT TTA ATG CCC TTA CTC TTT GCT 
Val Ser Arg Gly He Lys Glu Gly He Glu Lys Leu Asn Leu Val Leu Met Pro Leu Leu Phe Ala 

ACT TTT TTT GGT TTG CTT TTC TAT GCG ATG AGC ATG GAT TCT TTT TCT AAA GCT TTT CAT TTC ATG 
Thr Phe Phe Gly Leu Leu Phe Tyr Ala Met Ser Met Asp Ser Phe Ser Lys Ala Phe His Phe Met 

TTT GAT TTC AAA CCA AAA GAT TTG ACC TCT CAA GTG TTC ACT TAT TCC TTG GGG CAG GTT TTC TTT 
Phe Asp Phe Lys Pro Lys Asp Leu Thr Ser Gin Val Phe Thr Tyr Ser Leu Gly Gin Val Phe Phe 

TCC TTA AGC ATC GGT TTA GGG ATC AAT ATC ACT TAC GCT GCG GTT ACG GAT AAA ACG CAG AAT TTG 
Ser Leu Ser He Gly Leu Gly He Asn He Thr Tyr Ala Ala Val Thr Asp Lys Thr Gin Asn Leu 

CTT AAA AGC ACT ATT TGG GTG GTT TTA TCA GGA ATT CTA ATT TCT CTT GTG GGA GGA CTT ATG ATT 
Leu Lys Ser Thr lie Trp Val Val Leu Ser Gly He Leu He Ser Leu Val Ala Gly Leu Met lie 

TTC ACT TTT GTG TTT GAA TAT GGG GCG AAT GTC TCA CAA GGC ACA GGG TTA ATC TTC ACT TCT TTA 
Phe Thr Phe Val Phe Glu Tyr Gly Ala Asn Val Ser Gin Gly Thr Gly Leu He Phe Thr Ser Leu 

CCG GTG GTT TTT GGC CAA ATG GGA GCG ATA GGC ATT CTT GTT TCG ATT CTT TTC TTG CTC GCG CTC 
Pro Val Val Phe Gly Gin Met Gly Ala He Gly He Leu Val Ser He Leu Phe Leu Leu Ala Leu 

GCT TTT GCT GGC ATC ACT TCT ACG GTG GCT TTA TTG GAG CCA AGC GTG ATG TAT CTT ACC GAA AGG 
Ala Phe Ala Gly He Thr Ser Thr Val Ala Leu Leu Glu Pro Ser Val Met Tyr Leu Thr Glu Arg 

TAT CAA TAC TCT CGT TTT AAG GTT ACT TGG GGT CTT GTA GCA CTA ATT TTT GTG GTA GGC GTG GTG 
Tyr Gin Tyr Ser Arg Phe Lys Val Thr Trp Gly Leu Val Ala Leu He Phe Val Val Gly Val Val 

TTG ATT TTC TCG CTC CAT AAG GAT TAT AAA GAT TAT CTC ACT TTC TTT GAA AAA AGT CTT TTT GAT 
Leu He Phe Ser Leu His Lys Asp Tyr Lys Asp Tyr Leu Thr Phe Phe Glu Lys Ser Leu Phe Asp 

TGG TTG GAT TTT GCA TCA AGC ACC ATT ATC ATG CCT TTA GGC GGG ATG GCA ACC TTT ATT TTT ATG 
Trp Leu Asp Phe Ala Ser Ser Thr He He Met Pro Leu Gly Gly Met Ala Thr Phe He Phe Met 

GGT TGG GTT TTG AAA AAA GAA AAA TTG CGT CTT TTG AGC GTG CAC TTT TTA GGC CCT AAA TTG TTT 
Gly Trp Val Leu Lys Lys Glu Lys Leu Arg Leu Leu Ser Val His Phe Leu Gly Pro Lys Leu Phe 

GCA ACT TGG TAT TTC TTG CTT AAA TAT ATC ACC CCT TTA ATT GTG TTT TCC ATT TGG TTG AGC AAG 
Ala Thr Trp Tyr Phe Leu Leu Lys Tyr He Thr Pro Leu He Val Phe Ser He Trp Leu Ser Lys 

ATT TAT TAA 
lie Tyr 
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GTG GTC TTT AAA ATT TTA GGT TTA TGG TTA GGG GTG TTT TGT TTC CTT GAG GCT ACG CCT TAT TTA 
Met Val Phe Lys He Leu Gly Leu Trp Leu Gly Val Phe Cys Phe Leu Glu Ala Thr Pro Tyr Leu 

TAC TTG GGC GAA GAG CCT AAA TAT AAA GAC AAT TTC ACG CAT TTT GAA TAC GCT AAC CCT AAC GCT 
Tyr Leu Gly Glu Glu Pro Lys Tyr Lys Asp Asn Phe Thr His phe Glu Tyr Ala Asn Pro Asn Ala 

AAA AAG GGC GGT GTT TTA AGG AAT GAC GCC ATA GGG ACT TTT GAT AGC CTT AAC CCT TTC GCG CTT 
Lys Lys Gly Gly Val Leu Arg Asn Asp Ala He Gly Thr Phe Asp Ser Leu Asn Pro Phe Ala Leu 

AAA GGC ACT AAA GCT GAA GGC TTG GAT CTG ATT TAT GAC ACT TTA ATG GTG CAA AGT TTA GAC GAA 
Lys Gly Thr Lys Ala Glu Gly Leu Asp Leu He Tyr Asp Thr Leu Met Val Gin Ser Leu Asp Glu 

CCT TTT GCC GAA TAC CCC TTG ATC GCT AAA GAC GCA GAA GTG GCT AAG GAT AAC AGC TAT GTG ATT 
Pro Phe Ala Glu Tyr Pro Leu He Ala Lys Asp Ala Glu Val Ala Lys Asp Asn Ser Tyr Val He 

TTT ACG ATA GAT AAA AGA GCG AGA TTT AGC AAT AAC GCT CCC ATT TTA GCG AGC GAC GTG AAG TTT 
Phe Thr He Asp Lys Arg Ala Arg Phe Ser Asn Asn Ala Pro He Leu Ala Ser Asp Val Lys Phe 

AGT TTT GAT ACG ATC ATG AAA TTA GGA TCG CCT ATT TAT AGG CAG TAT TAC CAA GAT GTT AAA AAG 
Ser Phe Asp Thr He Met Lys Leu Gly Ser Pro He Tyr Arg Gin Tyr Tyr Gin Asp Val Lys Lys 
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GCG GTT GTT TTA GAC AAA CAC CAT GTT AAA TTC ATT TTC AAA ACC ACT GAA AAT AAA GAG TTG CCT 
Ala Val Val Leu Asp Lys His His Val Lys Phe lie Phe Lys Thr Thr Glu Asn Lys Glu Leu Pro 

CTC ATT TTA GGG CAG TTG CAG ATC TTT TCC AAA AAA GCG TTT CAA GAG GAT TAT TTT GAA AAA AAC 
Leu He Leu Gly Gin Leu Gin lie Phe Ser Lys Lys Ala Phe Gin Glu Asp Tyr Phe Glu Lys Asn 

CCC TTA CTC ATT CCT GTT TCT AGC GGC CCT TAT GTG ATC GCT TCT TTT GAT GTG GGC AAG AAA ATC 
Pro Leu Leu He Pro Val Ser Ser Gly Pro Tyr Val He Ala Ser Phe Asp Val Gly Lys Lys lie 

ACC TAC CAA AGA AAC CCT AAT TAT TGG GCG AGG AAT TTG CCT AGC AGA AAG GGG CAA TTC AAT TTT 
Thr Tyr Gin Arg Asn Pro Asn Tyr Trp Ala Arg Asn Leu Pro Ser Arg Lys Gly Gin Phe Asn Phe 

GAT CAA ATC AAA TTT GAG TAT TAC AAA GAC GAA ACC ATC GCC TTA CAG GCT TTT TTA AGT GGG GCG 
Asp Gin He Lys Phe Glu Tyr Tyr Lys Asp Glu Thr He Ala Leu Gin Ala Phe Leu Ser Gly Ala 

TAT GAT TGG CGT CTT GAA AGC ACG GCT AAG GTT TGG GCT AGG GGC TAT GTG GGG AAA GCT ATG GAC 
Tyr Asp Trp Arg Leu Glu Ser Thr Ala Lys Val Trp Ala Arg Gly Tyr Val Gly Lys Ala Met Asp 

AAT AAA GAG ATT ACG AAA TAT TTG ATA GCC CAC AAA ATG CCA AGC GGC ATG CAA GGG TTT TTC TTC 
Asn Lys Glu He Thr Lys Tyr Leu He Ala His Lys Met Pro Ser Gly Met Gin Gly Phe Phe Phe 

AAC ACG CGC CGA GAA ATT TTC AAG GAT AAA AGG GTG CGT GAA GCC TTA TTT TAT GCG TTT GAT TTT 
Asn Thr Arg Arg Glu He Phe Lys Asp Lys Arg Val Arg Glu Ala Leu Phe Tyr Ala Phe Asp Phe 

GAA TGG GCG AAT AAA AAT TTG TTT TTT TCG CAA TAC AAG CGC ACC ACC AGT TTT TTC AGT AAC TCT 
Glu Trp Ala Asn Lys Asn Leu Phe Phe Ser Gin Tyr Lys Arg Thr Thr Ser Phe Phe Ser Asn Ser 

ATC TAT GCG TCC CCT CCC CTC CCA AGC CCT GAA GAA AAA GCC TTG CTA GCC CCT TAT GAA AAG AGT 
He Tyr Ala Ser Pro Pro Leu Pro Ser Pro Glu Glu Lys Ala Leu Leu Ala Pro Tyr Glu Lys Ser 

TTG GAT GAA AGG GTT TTT AAA GAG CCT TAT GTC GTG CCT AGA ACC GAT GGA GTT GAT GTT TTA GGC 
Leu Asp Glu Arg Val Phe Lys Glu Pro Tyr Val Val Pro Arg Thr Asp Gly Val Asp Val Leu Gly 

TAT AAT TTG AGG GAA AAT TTA AAA TAC GCC CAA AAG CTT TTA GAG AGC ACG GGC TTT TCT TAC AAA 
Tyr Asn Leu Arg Glu Asn Leu Lys Tyr Ala Gin Lys Leu Leu Glu Ser Thr Gly Phe Ser Tyr Lys 

AAC ATG CGT TTG GTG GAT AAG AAT AAC AAG CCT TTC AGT TTC ACT TTG CTT TTA AAT AGC CCG GCA 
Asn Met Arg Leu Val Asp Lys Asn Asn Lys Pro Phe Ser Phe Thr Leu Leu Leu Asn Ser Pro Ala 

TTT GAA AGA CTG GCC CTA GCT TTT GCT AAA AAC TTA AGG GTG TTA GGG ATT GAA ATG AAA ATC CAA 
Phe Glu Arg Leu Ala Leu Ala Phe Ala Lys Asn Leu Arg Val Leu Gly He Glu Met Lys He Gin 

AGA GTG GAT TTA AGC CAG TAT GTC AAT CGG ATC AAA AGC TAT GAT TTT GAC ATG ATT GTA GGA GTG 
Arg Val Asp Leu Ser Gin Tyr Val Asn Arg He Lys Ser Tyr Asp Phe Asp Met He Val Gly Val 

ATT GGC CAA TCG TCT TTC CCA GGT AAT GAG CAG CGC TTT TAT TTT GGT TCT TTG AGT GCG AAA GAA 
He Gly Gin Ser Ser Phe Pro Gly Asn Glu Gin Arg Phe Tyr Phe Gly Ser Leu Ser Ala Lys Glu 

AAA GGC ACA AGG AAT TAT GCG GGA ATC TCT AGT AAA GCG GTA GAT GAT TTG ATT GAA AAA ATC ATT 
Lys Gly Thr Arg Asn Tyr Ala Gly He Ser Ser Lys Ala Val Asp Asp Leu He Glu Lys He He 

AAC GCT AAA GAT TAC AAG GAA CAA TTG GCC GCC ATT CAA GCG ATG GAT AGG GTA TTG TTG TGG GGG 
Asn Ala Lys Asp Tyr Lys Glu Gin Leu Ala Ala He Gin Ala Met Asp Arg Val Leu Leu Trp Gly 



TTT TAT GTG ATA CCG CAT TTT TAT TTG CCT AAT TAC AGG ATC GCA GCG TAT AAT TAC ATT GGC ATG 
Phe Tyr Val He Pro His Phe Tyr Leu Pro Asn Tyr Arg He Ala Ala Tyr Asn Tyr He Gly Met 

CCT GAA ATC AGC CCT AGC TAT GGA TTT TCG CCG TAT TTG TGG TGG ATA AAA GAA AAG GAT CTT CAA 
Pro Glu He Ser Pro Ser Tyr Gly Phe Ser Pro Tyr Leu Trp Trp He Lys Glu Lys Asp Leu Gin 

TGA 



HPN137 

ATG AAA AAT CAA CAC AAA AAT CCC CTA ACA AAA GCT TTA ATG AAA ACT TAT CCA TAT AAC CAT TTT 
Met Lys Asn Gin His Lys Asn Pro Leu Thr Lys Ala Leu Met Lys Thr Tyr Pro Tyr Asn His Phe 

TTA TTT TTC TGC TTT ATT CTA GGA GCG TTT TTA TTA GGT TTG CTC AGT CCA GCT TAT GCT TTA AGT 
Leu Phe Phe Cys Phe He Leu Gly Ala Phe Leu Leu Gly Leu Leu Ser Pro Ala Tyr Ala Leu Ser 

ATT ATC ACC ACT AAA GAA ATT GAC GCT AAT TTG CTT AAT GGA GCG ATA GAA AGC AGG GTG GTG TTA 
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Abbildung 15 

He lie Thr Thr Lys Glu He Asp Ala Asn Leu Leu Asn Gly Ala He Glu Ser Arg Val Val Leu 

GGC AAG AGG GTG TTT AAA GTA GAA GCT CAT GGG TTT TAT TTT AGA AAC AAT GCG ACT AAC AGC ATA 
Gly Lys Arg Val Phe Lys Val Glu Ala His Gly Phe Tyr Phe Arg Asn Asn Ala Thr Asn Ser He 

GAT ATA GAA ATC ACC AGT CTT TTA AGA GAC AAT CAA TCG TTT CCT TTG ACT AGC AGT GCT AAA ACC 
Asp He Glu He Thr Ser Leu Leu Arg Asp Asn Gin Ser Phe Pro Leu Thr Ser Ser Ala Lys Thr 

AGT TTA AAA ATA CCT CCT AAC GCC AAG ATT AAA AAA TCC ACT ATC CTT GTT TTG AAA GGC GAG AAC 
Ser Leu Lys He Pro Pro Asn Ala Lys He Lys Lys Ser Thr He Leu Val Leu Lys Gly Glu Asn 

GCT GAA GAA GTG GCT AAG ATT TTA GGC GTT AGC AAA GAA GAA TAC CAA AAG CTA GAA AAC ATC GCT 
Ala Glu Glu Val Ala Lys He Leu Gly Val Ser Lys Glu Glu Tyr Gin Lys Leu Glu Asn He Ala 

CAA ACC AAA GCG GCT AAT GAC CCT ATG TAT GCT AAC ACG CCT TTT AGT AAT GGT TCT GAT AGT TCC 
Gin Thr Lys Ala Ala Asn Asp Pro Met Tyr Ala Asn Thr Pro Phe Ser Asn Gly Ser Asp Ser Ser 

TTT TAC GAT AAC AAT CCT AAT AGC CCT AGC AAT AAC GCT ATC AAT GGC AAA GAT GGC GCA AAT GGG 
Phe Tyr Asp Asn Asn Pro Asn Ser Pro Ser Asn Asn Ala He Asn Gly Lys Asp Gly Ala Asn Gly 

AGT AAC GGC TAT GGG GCA AAT GGC AAT GAT GGG GTA AAT GGG ATC AGT GGG AGT AAT GGT GCA AAT 
Ser Asn Gly Tyr Gly Ala Asn Gly Asn Asp Gly Val Asn Gly He Ser Gly Ser Asn Gly Ala Asn 

GGG AGT CAT TCA AAT AAT AAT GCA ATA GGC AGT GGT ATT GAT ACA GAT GGC GTG TTA GGG GTG GAT 
Gly Ser His Ser Asn Asn Asn Ala He Gly Ser Gly He Asp Thr Asp Gly Val Leu Gly Val Asp 

GGG GTG AAT GGC TCT AGT TCT TCA AGT GGC GGC TCT GTA GGG GGT TAT GAG AAT AAT TTC ACT AAT 
Gly Val Asn Gly Ser Ser Ser Ser Ser Gly Gly Ser Val Gly Gly Tyr Glu Asn Asn Phe Thr Asn 

CAT GGC TCT ACT AAC AAT AAC ACA GGA GGG TAT GAC AAT TTT AAT AAT GGC AGC TCA AGT GGT GGG 
His Gly Ser Thr Asn Asn Asn Thr Gly Gly Tyr Asp Asn Phe Asn Asn Gly Ser Ser Ser Gly Gly 

AGT TTA GGG AAT GGG GGG CTT TTC CCT ATT CCT TTT GGT AAT GGA GAC ACA AAC AAT TCC AAT AAT 
Ser Leu Gly Asn Gly Gly Leu Phe Pro He Pro Phe Gly Asn Gly Asp Thr Asn Asn Ser Asn Asn 

TCC ACT AAC ACC ACT AGC CCA ACT AAT GGC AGT AGT TCT AAT AAC GCC ACT AAT CCT AGT TCG CAA 
Ser Thr Asn Thr Thr Ser Pro Thr Asn Gly Ser Ser Ser Asn Asn Ala Thr Asn Pro Ser Ser Gin 

GAA AAC AAT TAC TCC AGC CAG TAT TGT AAA GTG CCA GAG TTA AGC CCC AAC AAC ACG ATG AAA CTA 
Glu Asn Asn Tyr Ser Ser Gin Tyr Cys Lys Val Pro Glu Leu Ser Pro Asn Asn Thr Met Lys Leu 

GAT GTT ATC GCT AAA GAT GGC TCT TGT ATT TCT ATG AAC GCT TTA AGA GAT GAC ACT AAA TGC GCT 
Asp Val He Ala Lys Asp Gly Ser Cys He Ser Met Asn Ala Leu Arg Asp Asp Thr Lys Cys Ala 

TAT AGA TAC GAT TTT GAA GCC GGT AAA GCC ATC AAG CAA ACG CAA TAC TAC TAT GTA GAT AGG GAA 
Tyr Arg Tyr Asp Phe Glu Ala Gly Lys Ala He Lys Gla Thr Gin Tyr Tyr Tyr Val Asp Arg Glu 

AAT AAA ACG CAA AAT ATC GGT GGT TGT GTG GAT TTA CAA GGC GCT CAA TAC GCC ATG CAA CTT TAC 
Asn Lys Thr Gin Asn He Gly Gly Cys Val Asp Leu Gin Gly Ala Gin Tyr Ala Met Gin Leu Tyr 

AAA GAT GAC AGC AAA TGC GCC TTA CAA ACC ACG AGC GAT AAA GGT TAT GGT ATG GGG AAA ACG CAA 
Lys Asp Asp Ser Lys Cys Ala Leu Gin Thr Thr Ser Asp Lys Gly Tyr Gly Met Gly Lys Thr Gin 

ACC TTT CAA ACT GAA ATC GTG TTT CGT GGG ATG GAC AAT TTA ATC CAT GTC GCT GTG CCT TGC AGC 
Thr Phe Gin Thr Glu He Val Phe Arg Gly Met Asp Asn Leu He His Val Ala Val Pro Cys Ser 

GAT TAT GCA AGG GTG CAA GAC AGG ATT GTT AGG TAT GAA AAA AAT GAT AAA ACC CAA ACC TTA ACG 
Asp Tyr Ala Arg Val Gin Asp Arg He val Arg Tyr Glu Lys Asn Asp Lys Thr Gin Thr Leu Thr 

CCT ATA GTG GAT CAG TAT TAT AAT GAT CCT AAC AAC CCT AAC AAG CAA GAG ATT TTA AAT CGT GGG 
Pro He Val Asp Gin Tyr Tyr Asn Asp Pro Asn Asn Pro Asn Lys Gin Glu He Leu Asn Arg Gly 

ATT GCC ACC CAA TTA AGC TCG CAA TAT CAA GAA TTT GCA TGC GGT CAA TGG GAA TAC AAT GAC GCT 
He Ala Thr Gin Leu Ser Ser Gin Tyr Gin Glu Phe Ala Cys Gly Gin Trp Glu Tyr Asn Asp Ala 

AAA TTA GAA GCC AAA AGA CCT ACA ATG CTA AAA AGC TAT AAC AAG CTT AAT GGA GAA TGG GTA GAA 
Lys Leu Glu Ala Lys Arg Pro Thr Met Leu Lys Ser Tyr Asn Lys Leu Asn Gly Glu Trp Val Glu 



GTT ACG CCC TGT AAT TTT GAA GCA GGG ATT AAA AGC GGT GCG GTT GTT AGC CCT TAT GTG ATG GGC 
Val Thr Pro Cys Asn Phe Glu Ala Gly He Lys Ser Gly Ala Val Val Ser Pro Tyr Val Met Gly 

GTG CCT AGT TCT AAA GTC TTA AGC GAT ATT ACT ACA AGC CAT TAT TTT AGG ATA GAA AGG AAA AAT 
Val Pro Ser Ser Lys Val Leu Ser Asp He Thr Thr Ser His Tyr Phe Arg He Glu Arg Lys Asn 
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HPN172 

ATG TTG GGG AGC GTC AAA AAA GCG GTT TTT AGG GTT TTG TGT TTG GGG GCG TTG TGT TTA TGC GGG 
Met Leu Gly Ser Val Lys Lys Ala Val Phe Arg Val Leu Cys Leu Gly Ala Leu Cys Leu Cys Gly 

GGG TTA ATG GCA GAG CAA GAT CCT AAA GAG CTT ATA TTT TCA GGT ATA ACT ATT TAC ACG GAT AAA 
Gly Leu Met Ala Glu Gin Asp Pro Lys Glu Leu He Phe Ser Gly He Thr He Tyr Thr Asp Lys 

AAT TTC ACT AGA GCT AAG AAA TAT TTT GAA AAA GCT TGC AAA TCA AAC GAT GCT GAT GGC TGT GCA 
Asn Phe Thr Arg Ala Lys Lys Tyr Phe Glu Lys Ala Cys Lys Ser Asn Asp Ala Asp Gly Cys Ala 

ATC TTA AGA GAG GTT TAT TCT AGT GGT AAA GCC ATA GCG AGA GAA AAC GCA AGA GAG AGC ATT GAA 
He Leu Arg Glu Val Tyr Ser Ser Gly Lys Ala He Ala Arg Glu Asn Ala Arg Glu Ser He Glu 

AAA GCT CTT GAA CAC ACC GCT ACT GCT AAA GTT TGT AAA TTA AAC GAT GCT GAA AAA TGC AAG GAC 
Lys Ala Leu Glu His Thr Ala Thr Ala Lys Val Cys Lys Leu Asn Asp Ala Glu Lys Cys Lys Asp 

TTA GCA GAG TTT TAT TTT AAT GTA AAC GAT CTT AAA AAT GCT TTA GAA TAT TAC TCT AAA TCT TGT 
Leu Ala Glu Phe Tyr Phe Asn Val Asn Asp Leu Lys Asn Ala Leu Glu Tyr Tyr Ser Lys Ser Cys 

AAG TTA AAT AAT GTT GAA GGG TGT ATG CTG TCA GCA ACT TTT TAT AAC GAT ATG ATA AAG GGT TTG 
Lys Leu Asn Asn Val Glu Gly Cys Met Leu Ser Ala Thr Phe Tyr Asn Asp Met He Lys Gly Leu 

AAA AAA GAT AAA AAA GAT CTA GAA TAT TAT TCT AAA GCT TGC GAG TTA AAT AAC GGT GGA GGG TGT 
Lys Lys Asp Lys Lys Asp Leu Glu Tyr Tyr Ser Lys Ala Cys Glu Leu Asn Asn Gly Gly Gly Cys 

TCT AAA TTA GGA GGG GAT TAT TTT TTT GGT GAA GGC GTA ACA AAA GAT TTC AAA AAA GCT TTT GAA 
Ser Lys Leu Gly Gly Asp Tyr Phe Phe Gly Glu Gly Val Thr Lys Asp Phe Lys Lys Ala Phe Glu 

TAT TCT GCC AAA GCT TGT GAG TTG AAC GAT GCT AAA GGG TGT TAC GCT CTA GCA GCG TTT TAT AAT 
Tyr Ser Ala Lys Ala Cys Glu Leu Asn Asp Ala Lys Gly Cys Tyr Ala Leu Ala Ala Phe Tyr Asn 

GAG GGT AAA GGC GTG GCA AAG GAT GAA AAG CAA ACG ACA GAA AAC CTT GAA AAG AGT TGC AAG CTA 
Glu Gly Lys Gly Val Ala Lys Asp Glu Lys Gin Thr Thr Glu Asn Leu Glu Lys Ser Cys Lys Leu 

GGA TTA AAA GAA GCA TGC GAT ATT CTC AAA GAA CAA AAA CAA TAA 
Gly Leu Lys Glu Ala Cys Asp He Leu Lys Glu Gin Lys Gin 
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ACC CCT TAT AGT GCT TCA AAA ACC ACT CTT GGG CCT AAT GAA CAG CTT GTT TTA ACC CAA GAT TTA 
Thr Pro Tyr Ser Ala Ser Lys Thr Thr Leu Gly Pro Asn Glu Gin Leu Val Leu Thr Gin Asp Leu 

GGC GCT CTT ACC ATC ATT AAA ACC CTG ACT TTT TAT GAT GAT TTG CAT TAT GAT TTA AAA ATC GCC 
Gly Ala Leu Thr lie lie Lys Thr Leu Thr Phe Tyr Asp Asp Leu His Tyr Asp Leu Lys lie Ala 

TTC AAA TCG CCT AAC AAT ATT ATC CCT AGC TAT GTG ATC ACT AAT GGT TAC AGA CCG GTG GCT GAT 
Phe Lys Ser Pro Asn Asn He He Pro Ser Tyr Val He Thr Asn Gly Tyr Arg Pro Val Ala Asp 

TTG GAC AGC TAC ACC TTT TCG GGC GTG CTT TTA GAA AAC AAC GAC AAA AAA ATT GAA AAA ATT GAA 
Leu Asp Ser Tyr Thr Phe Ser Gly Val Leu Leu Glu Asn Asn Asp Lys Lys He Glu Lys He Glu 

GAT AAA GAC GCT AAA GAA ATC AAA CGC TTT TCT AAC ACC CTC TTT TTA TCC AGC GTG GAT AGG TAT 
Asp Lys Asp Ala Lys Glu He Lys Arg Phe Ser Asn Thr Leu Phe Leu Ser Ser Val Asp Arg Tyr 

TTC ACC ACT TTG CTT TTC ACT AAA GAT TCT CAA GGT TTT GAA GCC TTA ATT GAT TCA GAA ATC GGC 
Phe Thr Thr Leu Leu Phe Thr Lys Asp Ser Gin Gly Phe Glu Ala Leu He Asp Ser Glu He Gly 

ACT AAA AAA CCC TTA GGG TTC ATT TCC CTT AAA AAT GAA GCG AAT TTG CAT GGT TAT ATT GGC CCT 
Thr Lys Lys Pro Leu Gly Phe He Ser Leu Lys Asn Glu Ala Asn Leu His Gly Tyr He Gly Pro 

AAA GAT TAC CGC TCT TTG AAA GCG ATT TCA CCC ATG CTC ACT GAT GTG ATA GAG TAT GGT TTA ATC 
Lys Asp Tyr Arg Ser Leu Lys Ala He Ser Pro Met Leu Thr Asp Val He Glu Tyr Gly Leu He 

ACT TTC TTT GCG AAA GGC GTG TTT GTT TTA CTG GAT TAT TTG TAT CAA TTC GTG GGC AAT TGG GGT 
Thr Phe Phe Ala Lys Gly Val Phe Val Leu Leu Asp Tyr Leu Tyr Gin Phe val Gly Asn Trp Gly 

TGG GCT ATC ATT TTT TTA ACG ATT ATC GTG CGC CTA ATC CTT TAC CCC TTA AGC TAT AAA GGC ATG 
Trp Ala He He Phe Leu Thr He He Val Arg Leu He Leu Tyr Pro Leu Ser Tyr Lys Gly Met 

GTG AGC ATG CAA AAG CTC AAA GAA TTA GCC CCC AAA ATG AAA GAA CTC CAA GAA AAA TAC AAG GGC 
Val Ser Met Gin Lys Leu Lys Glu Leu Ala Pro Lys Met Lys Glu Leu Gin Glu Lys Tyr Lys Gly 

GAA CCC CAA AAG TTG CAA GCC CAC ATG ATG CAG CTT TAC AAA AAA CAT GGG GCC AAC CCG CTA GGG 
Glu Pro Gin Lys Leu Gin Ala His Met Met Gin Leu Tyr Lys Lys His Gly Ala Asn Pro Leu Gly 

GGT TGT CTG CCC TTA ATC TTA CAA ATC CCG GTG TTT TTT GCG ATT TAT AGA GTG CTT TAT AAC GCT 
Gly Cys Leu Pro Leu He Leu Gin He Pro Val Phe Phe Ala He Tyr Arg Val Leu Tyr Asn Ala 

GTG GAA TTG AAA AGC TCA GAG TGG ATC TTA TGG ATT CAT GAT TTA TCC ATC ATG GAT CCG TAT TTT 
Val Glu Leu Lys Ser Ser Glu Trp He Leu Trp He His Asp Leu Ser He Met Asp Pro Tyr Phe 

ATT TTA CCG CTT CTT ATG GGA GCG TCT ATG TAT TGG CAC CAA AGC GTT ACG CCA AAC ACC ATG ACC 
He Leu Pro Leu Leu Met Gly Ala Ser Met Tyr Trp His Gin Ser Val Thr Pro Asn Thr Met Thr 

GAT CCC ATG CAA GCG AAG ATT TTT AAA CTC TTA CCC CTA TTA TTT ACA ATC TTT TTA ATC ACT TTC 
Asp Pro Met Gin Ala Lys He Phe Lys Leu Leu Pro Leu Leu Phe Thr He Phe Leu He Thr Phe 

CCT GGA GGG TTA GTC TTG TAT TGG ACC ACA AAC AAC ATC CTT TCG GTG TTG CAA CAA CTC ATT ATT 
Pro Ala Gly Leu Val Leu Tyr Trp Thr Thr Asn Asn He Leu Ser Val Leu Gin Gin Leu He He 

AAT AAA GTT TTA GAG AAT AAA AAA CGA GCG CAC CGC GAA AAC AAA AAG GAA CAT TGA 
Asn Lys Val Leu Glu Asn Lys Lys Arg Ala His Arg Glu Asn Lys Lys Glu His 
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TAT GCG GGG ACT TCT CAA TCA 
Tyr Ala Gly Thr Ser Gin Ser 

CGA TAC GAT TAC AAA GAT GTT 
Arg Tyr Asp Tyr Lys Asp Val 

AGC GGA TCG AAT CAA GGG TGG 
Ser Gly Ser Asn Gin Gly Trp 

TTT TGG TGG TGG AGT TCT TFT 
Phe Trp Trp Trp Ser Ser Phe 

ACC GTG CCT TAT TTG AAA AAG 
Thr Val Pro Tyr Leu Lys Lys 

CAT GGG ATC ACC ACA ACC TAT 
His Gly lie Thr Thr Thr Tyr 
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GCG AGC TAT CAT GCA AGG CCT 
Ala Ser Tyr His Ala Arg Pro 

TTT GGG TTT AAA GCG GGG CGC 
Phe Gly Phe Lys Ala Gly Arg 

GAA GTG TAT TAT CAG CCC TAT 
Glu Val Tyr Tyr Gin Pro Tyr 

GGG AGA GGT TTA GCG TTT AAC 
Gly Arg Gly Leu Ala Phe Asn 

GGA GGC AAT CCT GAT AAC AGC 
Gly Gly Asn Pro Asp Asn Ser 

TCT TAT AAA GGT TTA GAC GCT 
Ser Tyr Lys Gly Leu Asp Ala 
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TAT GTG GTG GAT ACC GCT TTT TTA 
Tyr Val Val Asp Thr Ala Phe Leu 

TAT GAA GCG AAT ATT GAT TTC ATG 
Tyr Glu Ala Asn lie Asp Phe Met 

AAG ACT GAG ACG CAA AGG TTA AGG 
Lys Thr Glu Thr Gin Arg Leu Arg 

TCT TGG ATT TAT GAG TTT TTC GCG 
Ser Trp lie Tyr Glu Phe Phe Ala 

AAC GAT TTC ATC AAT TAT GGC TGG 
Asn Asp Phe lie Asn Tyr Gly Trp 

CAA TTT TTT TAT ATT 
Gin Phe Phe Tyr lie 



HPC012 

ATG AAT TTT TTT AAA ATC CTT TTA ATG GAA TTA AGG GCT ATT GTT TCT CAT AAA GGC GTT TTA TTA 
Met Asn Phe Phe Lys lie Leu Leu Met Glu Leu Arg Ala lie Val Ser His Lys Gly Val Leu Leu 

ATC CTT ATA GGC GCT CCT TTA ATC TAT GGC TTG TTA TAC CCT TTG CCT TAT TTA AAA GAC ATC GTA 
lie Leu lie Gly Ala Pro Leu lie Tyr Gly Leu Leu Tyr Pro Leu Pro Tyr Leu Lys Asp He Val 

ACG CAG CAA AAA ATC GCC CTT GTA GAT GAA GAC AAT TCC TTC CTT TCT AGG CAA TTA GCC TTC ATG 
Thr Gin Gin Lys lie Ala Leu Val Asp Glu Asp Asn Ser Phe Leu Ser Arg Gin Leu Ala Phe Met 

GCG CAA AGC TCC AAC GAG TTA GAA ATC GCT TTT TTT AGC CCC TCT ATG CTG GAA GCC AAA AAG CTT 
Ala Gin Ser Ser Asn Glu Leu Glu He Ala Phe Phe Ser Pro Ser Met Leu Glu Ala Lys Lys Leu 

TTA AAA GAA GAA AAA ATT TAT GGG ATC TTG CAT ATC CCT TCG TAT TTT GAA GCC AAT ATC CAT AAG 
Leu Lys Glu Glu Lys He Tyr Gly He Leu His He Pro Ser Tyr Phe Glu Ala Asn He His Lys 

CAG GTG CCT GTA ACG ATA GAT TTT TAT GCG AAT TCC AAT TAC TTT TTG ATT TAT GGC ACC TTA GCG 
Gin Val Pro Val Thr He Asp Phe Tyr Ala Asn Ser Asn Tyr Phe Leu He Tyr Gly Thr Leu Ala 

AAT GCG GTG GTG GAG AGC ATC AAC GCT TTA AAT GAT GAG ATA AGA TTC AAA CGC AAC GCC CAA ATA, 
Asn Ala Val Val Glu Ser lie Asn Ala Leu Asn Asp Glu He Arg Phe Lys Arg Asn Ala Gin He 

GAA GAA GCT GAA TTA GGG ACA GAC GGG ATT AAA ATC AGG CCT ATC GCT TTG TAT AAC CCT AGT GAG. 
Glu Glu Ala Glu Leu Gly Thr Asp Gly He Lys He Arg Pro He Ala Leu Tyr Asn Pro Ser Glu 

GGG TAT TTG AAT TAC GCG CTC TCT AGC GTG TTT ATT TTC AYY TTA CAC CAG GTG ATG CTC ATT GCA 
Gly Tyr Leu Asn Tyr Ala Leu Ser Ser Val Phe He Phe ? Leu His Gin Val Met Leu He Ala 

AGC AGC ATG TTT ACT AGC TCT AGG CGT TTG GAA TTA GCC CTT TTA GAT AAA AAG CAA ATC GCT TTA 
Ser Ser Met Phe Thr Ser Ser Arg Arg Leu Glu Leu Ala Leu Leu Asp Lys Lys Gin He Ala Leu 

AGG CTG TGC GCA AGA CTC TTG GTG TTT ATG GCA GCG TTT AGC GKT TTT GTT TTG TTG TAT TTT GGG 
Arg Leu Cys Ala Arg Leu Leu Val Phe Met Ala Ala Phe Ser ? Phe Val Leu Leu Tyr Phe Gly 

GCG CTG TTT TCT TTT TAT GGG ATC GAA CGG CAT GCG AGT GCT TTA ATG GTG TTT TTG AAT AGC TCC 
Ala Leu Phe Ser Phe Tyr Gly He Glu Arg His Ala Ser Ala Leu Met val Phe Leu Asn Ser Ser 

ATA TTC ATG CTT GCA ACC TTG AGT TTG GGG TCG TTT TTA GGC GCA TGG ATC AAA AAT GAA GCC CAC 
He Phe Met Leu Ala Thr Leu Ser Leu Gly Ser Phe Leu Gly Ala Trp He Lys Asn Glu Ala His 

ACC ACT CAA ATC GTT TTG ATT TCT TCT TTG CCC TTG ATT TTT ATG ATG GGT TTT GTG TGG CCT TTT 
Thr Thr Gin He Val Leu He Ser Ser Leu Pro Leu He Phe Met Met Gly Phe Val Trp Pro Phe 

GAA TCC TTG CCC TCT TAT TTG CAG GTT TTC GTT CAA ATA GTG CCT GCT TAT CAT GGG ATC AGT TTG 
Glu Ser Leu Pro Ser Tyr Leu Gin Val Phe Val Gin He Val Pro Ala Tyr His Gly He Ser Leu 

TTA GGG CGA TTG AAT CAA ATG CAT GCG GAA TTT ATA GAT GTT TCT GTC CAT TTT TAT GCG CTT ATT 
Leu Gly Arg Leu Asn Gin Met His Ala Glu Phe He Asp Val Ser Val His Phe Tyr Ala Leu He 

GCG ATT TTT ATT GCG AGT TTT ATA GGG AGT GTC TTT AAA CTC AGC TCT TTA AAG AAA GCT TGT GAA 
Ala He Phe He Ala Ser Phe He Gly Ser Val Phe Lys Leu Ser Ser Leu Lys Lys Ala Cys Glu 

AAC GCT TAA 
Asn Ala 
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HPC013 

ATG AAA GCG TTA AAG ATT TTT TTA AAA AAA TCC CTT ATT CTG TTG TTG GCG ATT GCT TTA AGC CAC 
Met Lys Ala Leu Lys lie Phe Leu Lya Lys Ser Leu lie Leu Leu Leu Ala lie Ala Leu Ser His 

CTG AAC GCT GTG GCT ATG ATT GTG GAT AAT CCT ACG CAG AAT ATC TGG CAA CAA GCA AAA GAC GCT 
Leu Asn Ala Val Ala Met He Val Asp Asn Pro Thr Gin Asn He Trp Gin Gin Ala Lys Asp Ala 

ATA GAC AAG TCT CGC TTT GTT CAA CAG GTC AAT CAT TGG GCT GAC CAA ATC AAA AAA TAC CAA GAT 
He Asp Lys Ser Arg Phe Val Gin Gin Val Asn His Trp Ala Asp Gin He Lys Lys Tyr Gin Asp 

ATG ATA GAA AAA GCT CAA TCA ACC ATT AAC CAA CTA AAT AAA GTG AAT GAT ATT TTA CTG AAA ACC 
Met He Glu Lys Ala Gin Ser Thx He Asn Gin Leu Asn Lys Val Asn Asp He Leu Leu Lys Thr 

AAT CAG TTT ATG AAT GGT TCT ATT TTA AAT ATC CCT AAC CCT ATG GGT TTA GTA GAA AAT GCA ACT 
Asn Gin Phe Met Asn Gly Ser He Leu Asn He Pro Asn Pro Met Gly Leu Val Glu Asn Ala Thr 

CAA ATT GCC AAG AAT GTA AAG TCA AAC GCT CTC GCC CTA CAA GAA AGC GCT AAA AAC TAC AAT CTA 
Gin He Ala Lys Asn Val Lys Ser Asn Ala Leu Ala Leu Gin Glu Ser Ala Lys Asn Tyr Asn Leu 

GCC GAA AAA TTT TTA TTA CGA AAT ATT GCT AGC AAA TGC CCT GAA TTA GAT ATG AAT AAA ATT AAC 
Ala Glu Lys Phe Leu Leu Arg Asn He Ala Ser Lys Cys Pro Glu Leu Asp Met Aan Lys He Asn 

CCA AAA ACA AAA GAG ATT TTT TTC TCC GAT AAG GGA AAA GAA AAG AGT GCC GCT AGA CAA GCT TTA 
Pro Lys Thr Lys Glu He Phe Phe Ser Asp Lys Gly Lys Glu Lys Ser Ala Ala Arg Gin Ala Leu 

GAA AAT TTA GCT AAT GCA CTT GGA AAT ACA CAA ATT ACA ACC ACT CAA CAT ATA ACA ACA AGT TTA 
Glu Asn Leu Ala Asn Ala Leu Gly Asn Thr Gin He Thr Thr Thr Gin His He Thr Thr Ser Leu 

AGT GGT AGG GCT TTY AGC AGA CTT YAT TTG CAA AAC AAA AGA GCA AGA ACT TTT AGC AGA YAA AAA 
Ser Gly Arg Ala ? Ser Arg Leu ? Leu Gin Asn Lys Arg Ala Arg Thr Phe Ser Arg ? Lys 

AGC AAC AAT ACC TAG 
Ser Asn Asn Thr 

HPC024 

ATG ATG TTT TCT TCA ATG TTT GCT TCG TTA GGG ACT CGT ATC ATG CTG GTC GTG TTA GCC GCT CTT 
Met Met Phe Ser Ser Met Phe Ala Ser Leu Gly Thr Arg He Met Leu Val ValTleu Ala Ala Leu 

TTG GGT TTA GGG GGG CTT TTT ATT GGT TTT GTA AAG GTT ATG CAA AAA GAT GTG CTA GCG CAA CTC 
Leu Gly Leu Gly Gly Leu Phe He Gly Phe Val Lys Val Met Gin Lys Asp Val Leu Ala Gin. Leu 

ATG GAG CAT TTA GAA ACC GGG CAA TAC AAA AAG CGT GAA AAA ACG CTC GCT TAC ATG ACA AAA CTT 
Met Glu His Leu Glu Thr Gly Gin Tyr Lys Lys Arg Glu Lys Thr Leu Ala Tyr Met Thr Lys Leu 

CTT GAA CAG GGC ATT CAT GAA TAT TAC AAA AGT TTT GAC AAT GCT ACT GCA AGA AAA ATG GCG TTG 
Leu Glu Gin Gly He His Glu Tyr Tyr Lys Ser Phe Asp Asn Ala Thr Ala Arg Lys Met Ala Leu 

GAT TAT TTT AAA CGC ATC AAC GAC GAT AAA GGC ATG ATT TAT ATG GTG GTG GTG GAT AAA AAC GGG 
Asp Tyr Phe Lys Arg He Asn Asp Asp Lys Gly Met He Tyr Met Val Val Val Asp Lys Asn Gly 

GTG GTG CTG TTT GAT CCG 
Val Val Leu Phe Asp Pro 

HPC034 

ATG AAA AAA TTG GTT TTA ATC ATC TTT TTA ACG CTA ACA CTT TCA ATA TCT GCA AAA GAA GTG AAA 
Met Lys Lys Leu Val Leu He He Phe Leu Thr Leu Thr Leu Ser lie Ser Ala Lys Glu Val Lys 

ATA GTG TTT TTA GAA ACT TCA GAC ATT CAT GGG CGG CTT TTT TCG TAT GAT TAT GCG ACT GGC GAG 
He Val Phe Leu Glu Thr Ser Asp He His Gly Arg Leu Phe Ser Tyr Asp Tyr Ala Thr Gly Glu 

CAA AAA CCC GAT AAC GGC TTG ACA AGG ATT GCG ACT TTA ATC AAA AAG CAA AGG GCT GAA AAT AAA 
Gin Lys Pro Asp Asn Gly Leu Thr Arg He Ala Thr Leu He Lys Lys Gin Arg Ala Glu Asn Lys 

AAT GTG GTT TTG ATT GAC AGC GGG GAT TTG TTG CAG GGC AAT AGC GCG GAG TTG TTT AAC GAT GAG 
Asn Val Val Leu He Asp Ser Gly Asp Leu Leu Gin Gly Asn Ser Ala Glu Leu Phe Asn Asp Glu 

CCC ATT CAC CCG CTC GTT TTA GCC GAA AAC GAT TTG AAA TTT GAT ATT CGT GTG CTT GGG AAT CAC 
Pro He His Pro Leu Val Leu Ala Glu Asn Asp Leu Lys Phe Asp He Arg Val Leu Gly Asn His 

GAG TTT AAT TTC AGT AAG GAT TTT TTA GAG AAA AAC ATT AAG GGG TTT AAT GGT GAT GTC GTG AAT 
Glu Phe Asn Phe Ser Lys Asp Phe Leu Glu Lys Asn He Lys Gly Phe Asn Gly Asp Val Val Asn 
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GCG AAT ATC ATC AAG ACT ATA GAC AAT AAG CCG TTT GTA AAG CCT TAT GCA ATT AAA ACA ATT GAT 
Ala Asn lie lie Lys Thr He Asp Asn Lys Pro Phe Val Lys Pro Tyr Ala He Lys Thr lie Asp 

GGC GTG AGG GTG GCG GTT GTG GGG TAT GTG GTG GCG CAC ATC CCC ACT TGG GAG GCC GCT ACG CCT 
Gly Val Arg Val Ala Val Val Gly Tyr Val Val Ala His He Pro Thr Trp Glu Ala Ala Thr Pro 

GAA CAT TTT GCA GGT TTA AAG TTT TTG GAC GCC AAA GAA GCG TTA AAA AAG ACT TTG AAA GAG CTA 
Glu His Phe Ala Gly Leu Lys Phe Leu Asp Ala Lys Glu Ala Leu Lys Lys Thr Leu Lys Glu Leu 

AAA GGG AAG TAT GAT ATT TTG ATT GGT GCT TTT CAT TTG GGG CGA GAA GAT GAG AAA GGT GGC GAC 
Lys Gly Lys Tyr Asp He Leu He Gly Ala Phe His Leu Gly Arg Glu Asp Glu Lys Gly Gly Asp 

GGA ATA CCT GAT CTG GCG AAA AAA TTC CCG CAA TTT GAC ATC ATT TTT GCA GGG CAT GAG CAT GCG 
Gly He Pro Asp Leu Ala Lys Lys Phe Pro Gin Phe Asp He He Phe Ala Gly His Glu His Ala 

GTT TAT AAC ACC AAA ATA GGA AAG GTG CAT ACC ATT GAG CCT GGA GCG TAT GGG GCT TAT CTG GCA 
Val Tyr Asn Thr Lys He Gly Lys Val His Thr He Glu Pro Gly Ala Tyr Gly Ala Tyr Leu Ala 

AAA GGC GTG GTA GTA TTT GAC ACC AAA ACG AAG AAA AAA ATC GTA ACG ACT GAA AAT TTA CCC ACA 
Lys Gly Val Val Val Phe Asp Thr Lys Thr Lys Lys Lys He Val Thr Thr Glu Asn Leu Pro Thr 

AAA GGC GTG CCA GAA GAT GAA GAA TTA GCG AAA AAA TAT GAA TAT GTG GAT AAA AAA TCA AAA GAA 
Lys Gly Val Pro Glu Asp Glu Glu Leu Ala Lys Lys Tyr Glu Tyr Val Asp Lys Lys Ser Lys Glu 

TAC GCT AAT GAA GTG GTT GGC GAA GTT ACA AAA ACC TTT ATT GAC AGG CCT GAT TTC ATC ACA GGA 
Tyr Ala Asn Glu Val Val Gly Glu Val Thr Lys Thr Phe He Asp Arg Pro Asp Phe He Thr Gly 

GGA GAA AAA ATC ACT ACG ATG CCC ACC GCC GCC TTG CAA GAA ACA CCG GTG ATA GAA TTG ATC AAT 
Gly Glu Lys He Thr Thr Met Pro Thr Ala Ala Leu Gin Glu Thr Pro Val He Glu Leu He Asn 

AAA GTG CAA AAA TAT TAC GCA AAA GCC GAT GTT TCA GCG GCC GCC TTA TTC AAT TTT GGG GCC AAT 
Lys Val Gin Lys Tyr Tyr Ala Lys Ala Asp Val Ser Ala Ala Ala Leu Phe Asn Phe Gly Ala Asn 

TTG AAA AAA GGG CCT TTC AAA AGA AAA GAT GTC GCC TAC ATT TAC AAG TTC GCT AAC ACG CTC ATT 
Leu Lys Lys Gly Pro Phe Lys Arg Lys Asp Val Ala Tyr He Tyr Lys Phe Ala Asn Thr Leu He 

GGA GTG GAG ATA ACG GGT GAA AAT CTG TTG AAA TAC ATG GAA TGG TCG TAT CAA TTT TAC AAT CAG 
Gly Val Glu He Thr Gly Glu Asn Leu Leu Lys Tyr Met Glu Trp Ser Tyr Gin Phe Tyr Asn. Gin 

TTG CAA CCA GGC GAT TTA ACG ATC AGT TTT AAT GAA AAT ATT CGT GGT TAT AAC TTT GAT ATG TTT 
Leu Gin Pro Gly Asp Leu Thr He Ser Phe Asn Glu Asn He Arg Gly Tyr Asn Phe Asp Met Phe 

TCT GGC GTG AAA TAC CAG GTT GAT GTT ACA AAA CCC GCC 
Ser Gly Val Lys Tyr Gin Val Asp Val Thr Lys Pro Ala 

HPC036 

TTG GGT ATC AAT ATG TGT TCT AAA AAA ATA AGA AAT TTC ATT TTA TGC TTT GGT TTT ATT TTA AGC 
Met Gly He Asn Met Cys Ser Lys Lys He Arg Asn Phe He Leu Cys Phe Gly Phe He Leu Ser 

TTG CAC GCT GAA GAG AGT ATG ACT NTG ACT GAA GAA AAT ACC CCT AAA GAC GCT CCC ATT CTT TTG 
Leu His Ala Glu Glu Ser Met Thr ? Thr Glu Glu Asn Thr Pro Lys Asp Ala Pro He Leu Leu 

GAA GAA AAA CGC GCC CAA ACG CTA GAG TTT GAA GAA AAC AAG GAA GTT AAA AAG AAT ATT GAT GAA 
Glu Glu Lys Arg Ala Gin Thr Leu Glu Phe Glu Glu Asn Lys Glu Val Lys Lys Asn He Asp Glu 

AAA AGC CTG CTT GAA GAA ATC CAT AAG AAA AAA CGC CAG CTT TAC ATG CTC AAA GGG GAA TTG CAT 
Lys Ser Leu Leu Glu Glu He His Lys Lys Lys Arg Gin Leu Tyr Met Leu Lys Gly Glu Leu His 

GAA AAA AAT GAA TCC ATT TTA TTC CAA CGA ATG GCT AAA AAC AAG AGC GGT TTT TTT ATA GGC GTA 
Glu Lys Asn Glu Ser He Leu Phe Gin Arg Met Ala Lys Asn Lys Ser Gly Phe Phe He Gly Val 

ATT CTT GGC GAT ATA GGG ATT AAC GCT CAT CCT AAC ACC CGA TCT TAT GAG AGC TTT GAA CCT TTA 
He Leu Gly Asp He Gly He Asn Ala His Pro Asn Thr Arg Ser Tyr Glu Ser Phe Glu Pro Leu 

AGC AAC ATT CAA GAT TCT CCT TTA TTG TAT GGC TTA AGG AGC GGG TAT CAA AAG TAT TTT GCT AAC 
Ser Asn He Gin Asp Ser Pro Leu Leu Tyr Gly Leu Arg Ser Gly Tyr Gin Lys Tyr Phe Ala Asn 

GGG ATT AGC GCC TTA CGC TTT TAT GGG GAG TAT TTA GGG GGG GCG ATG AAA GGG TTT AAA AGC GAT 
Gly He Ser Ala Leu Arg Phe Tyr Gly Glu Tyr Leu Gly Gly Ala Met Lys Gly Phe Lys Ser Asp 

TCT TTA GCC TCT TAT CAA ACC GCA AGC TTG AAC ATT GAT TTG TTG ATG GAT AAG CCT ATT GAT AAA 
Ser Leu Ala Ser Tyr Gin Thr Ala Ser Leu Asn He Asp Leu Leu Met Asp Lys Pro He Asp Lys 
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GAA AAA AGG TTT GCG TTA GGG 
Glu Lys Arg Phe Ala Leu Gly 

TTA AAA GAG ATT AAA GGG TAT 
Leu Lys Glu lie Lys Gly Tyr 

ATG ACG CTT AAC CTC AAA CAC 
Met Thr Leu Asn Leu Lys His 

CAA ACT TTT TTA TAT TAT TTT 
Gin Thr Phe Leu Tyr Tyr Phe 



ATA TTT GGA GGC GTT GGA GTG GGG 
lie Phe Gly Gly Val Gly Val Gly 

TCA CAG CCT AAC GCT TTT GGA TTA 
Ser Gin Pro Asn Ala Phe Gly Leu 

CGC TTT GAA TTA GCC TTA AAA ATG 
Arg Phe Glu Leu Ala Leu Lys Met 

AAA AGC ACT AAT ATT TAT TAT ATT 
Lys Ser Thr Asn He Tyr Tyr He 



TGG AAT GGG ATG TAT CAA AAT 
Trp Asn Gly Met Tyr Gin Asn 

GTG CTA AAT TTA GGG GTG AGC 
Val Leu Asn Leu Gly Val Ser 

CCT CCC TTA AAA GAA ACT TCG 
Pro Pro Leu Lys Glu Thr Ser 

AGT TAC AAC TAT TTA TTG TAA 
Ser Tyr Asn Tyr Leu Leu 
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HPC039 

ATG TCA GAA AAA GAA AGA CTG 
Met Ser Glu Lys Glu Arg Leu 

AAG GTG TTT TTG ATC GTG GCT 
Lys Val Phe Leu lie Val Ala 

AGC ACG AGA GTC GCT CCT AAA 
Ser Thr Arg Val Ala Pro Lys 

ACT AAA GAC GAG AAA AAA GAC 
Thr Lys Asp Glu Lys Lys Asp 

AAG CTA GAC AAA GTA GCG GAT 
Lys Leu Asp Lys Val Ala Asp 

ACC AAT CAA ACT CAA ACG GAG 
Thr Asn Gin Thr Gin Thr Glu 

GCT GTT GAG CAC ACT AGC GCT 
Ala Val Glu His Thr Ser Ala 

AAG CCC AAA GCA ACC CCT AAA 
Lys Pro Lys Ala Thr Pro Lys 

CTA AAA GTC AAA AAA GAA GCT 
Leu Lys Val Lys Lys Glu Ala 

AAA GGG CAT TAT TTG CAA GTG 
Lys Gly His Tyr Leu Gin Val 

AAC CAA TTC CCC CAT AAG ATT 
Asn Gin Phe Pro His Lys He 

AGC AAG CAA GAA GCC TTA ATG 
Ser Lys Gin Glu Ala Leu Met 

GAA GCG CAT TAG 
Glu Ala His 
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AAT GAA GTG ATC TTA GAA GAA 
Asn Glu Val He Leu Glu Glu 

ATA GCC ATT ATC ATT TTA GCG 
He Ala He He He Leu Ala 

GAG ACT TTT TTA CAA ACC GAT 
Glu Thr Phe Leu Gin Thr Asp 

GAT GAG TTT GAA AGC TTG AAT 
Asp Glu Phe Glu Ser Leu Asn 

AAT GTT AAA AAA CAA GAA AAT 
Asn Val Lys Lys Gin Glu Asn 

ATG AAA ACA GCA GAA GAA ACG 
Met Lys Thr Ala Glu Glu Thr 

CAA AAA GAA TCT CAA GCT GTG 
Gin Lys Glu Ser Gin Ala Val 

GAT AAG GAA GCT CAT AAA GAT 
Asp Lys Glu Ala His Lys Asp 

CAT AAA GAA GTT CCT AAA AAA 
His Lys Glu Val Pro Lys Lys 

GGG GTT TTT GCG CAC ACG CCC 
Gly Val Phe Ala His Thr Pro 

GAA GAT AGG GGA GCA ACG AAG 
Glu Asp Arg Gly Ala Thr Lys 

CAT GCT GAT GAA GTC AGC AAA 
His Ala Asp Glu Val Ser Lys 



GAA AAT AAT GGG GGC GGC ACT AAA 
Glu Asn Asn Gly Gly Gly Thr Lys 

GTG CTT TTA ATG GTG TTT TGG AAA 
Val Leu Leu Met Val Phe Trp Lys 

AGC GGG ATG CAA AAA ATA GGC AAC 
Ser Gly Met Gin Lys He Gly Asn 

TTG GAT CCT TCC AAG CAA GAA GAC 
Leu Asp Pro Ser Lys Gin Glu Asp 

GAT GCG TTT AAC ATG CCC ACT CAA 
Asp Ala Phe Asn Met Pro Thr Gin 

CAA GAA GCT CAA AAA GAA TTA AAA 
Gin Glu Ala Gin Lys Glu Leu Lys 

GCT AAA AAA GAA ACC CCC CAT AAA 
Ala Lys Lys Glu Thr Pro His Lys 

AAA GAT AAG CAT GCG GTT AAA GAG 
Lys Asp Lys His Ala Val Lys Glu 

GCC AAT TCT AAA ACC ACT CTT ACT 
Ala Asn Ser Lys Thr Thr Leu Thr 

AAT AAA GCC TTT TTG CAA GCG TTT 
Asn Lys Ala Phe Leu Gin Ala Phe 

CGC TAT CTC ATA GGC CCT TAT AAG 
Arg Tyr Leu He Gly Pro Tyr Lys 

AAG ATG ACT AAA CCG GTT GTC ATA 
Lys Met Thr Lys Pro Val Val lie 



ERSATZBLATT (REGEL 26) 



WO 00/73502 



PCT/EP00/05024 



Abbildung 15 



HPC048 

ATG AAA TCT AAA AAA CTT TAT TTG GCT TTA ATC ATA GGG GTT TTA TTA GCG TTT TTA ACC CTA TCT 
Met Lys Ser Lys Lys Leu Tyr Leu Ala Leu lie lie Gly Val Leu Leu Ala Phe Leu Thr Leu Ser 

TCA TGG CTG GGT AAT AGC GGT TTA GTG GGG CGT TTT GGG GTG TGG TTT GCC GCA CTC AAT AAA AAA 
Ser Trp Leu Gly Asn Ser Gly Leu Val Gly Arg Phe Gly Val Trp Phe Ala Ala Leu Asn Lys Lys 

TAT TTT GGG TAT CTT TCA TTC ATT AAT CTG CCC TAT TTA GCG TGG GTT TTA TTC CTT TTA TAC AAG 
Tyr Phe Gly Tyr Leu Ser Phe lie Asn Leu Pro Tyr Leu Ala Trp Val Leu Phe Leu Leu Tyr Lys 

ACT ADA AAC CCT TTT ACA GAA ATC GTT TTA GAA AAA ACT TTA GGG CAT CTA TTA GGC ATT TTA TCT 
Thr ? Asn Pro Phe Thr Glu lie Val Leu Glu Lys Thr Leu Gly His Leu Leu Gly He Leu Ser 

TTG CTC TTT TTA CAA TCT AGC CTA TTG AAT GAA GGG GAA ATC GGC AAC AGC GTG CGT TTG TTT TTA 
Leu Leu Phe Leu Gin Ser Ser Leu Leu Asn Gin Gly Glu He Gly Asn Ser Val Arg Leu Phe Leu 

CGC CCT TTT ATA GGG GAT TTT GGG CTT TAT GCG CTG ATA ACG CTT ATG GTA GTT ATT TCT TAT TTG 
Arg Pro Phe He Gly Asp Phe Gly Leu Tyr Ala Leu He Thr Leu Met Val Val He Ser Tyr Leu 

ATT TTA TTC AAA CTA CCC CCT AAA AGC GTT TTT TAT CCT TAT ATG AAC AAA ACA CAA AAC CTT TTA 
He Leu Phe Lys Leu Pro Pro Lys Ser Val Phe Tyr Pro Tyr Met Asn Lys Thr Gin Asn Leu Leu 

AAA GAG ATT TAC AAA CAA TGC CTA CAA GCC TTT AGC CCT AAT TTT AGC CCA AAA AAA GAG GAT TTT 
Lys Glu He Tyr Lys Gin Cys Leu Gin Ala Phe Ser Pro Asn Phe Ser Pro Lys Lys Glu Asp Phe 

GAA AAC ACC TTA TCA GAT CTT CAA AAA AAA GAA ACC AAC AAC GAC AAA GAA AAA GAA AAT CTC AAA 
Glu Asn Thr Leu Ser Asp Leu Gin Lys Lys Glu Thr Asn Asn Asp Lys Glu Lys Glu Asn Leu Lys 

GAA AAC CCT ATT GAT GAA AAC CAC AAA ACC CCT AAC GAA GAA TCG TTT CTA GCG ATC CCT ACC CCC 
Glu Asn Pro He Asp Glu Asn His Lys Thr Pro Asn Glu Glu Ser Phe Leu Ala He Pro Thr Pro 

TAT AAC ACG ACT TTA AAC GAT TCA GAG CCG CAA GAA GGC TTG GTT CAA ATT TCC CCT CAC CCC CCT 
Tyr Asn Thr Thr Leu Asn Asp Ser Glu Pro Gin Glu Gly Leu Val Gin He Ser Pro His Pro Pro 

ACC CAT TAC ACC ATT TAC CCT AAA AGA AAC CGA TTT GAT GAT TTG ACT AAC CCC ACT AAC CCC CCT 
Thr His Tyr Thr He Tyr Pro Lys Arg Asn Arg Phe Asp Asp Leu Thr Asn Pro Thr Asn Pro Pro 

TTA AAA GAA CCT AAG CAA GAA ACC AAA GAA AGA GAA CCC ATG CCC ACA AAA GAA ACT CTT ACG CCC 
Leu Lys Glu Pro Lys Gin Glu Thr Lys Glu Arg Glu Pro Met Pro Thr Lys Glu Thr Leu Thr Pro 

GCC ACA CTC AAA CCT ATC ATA TCA GCA CCC GTC ATG CCC GCA TCT GCA CCC AAC CTA GAA AAT GAC 
Ala Thr Leu Lys Pro He He Ser Ala Pro Val Met Pro Ala Ser Ala Pro Asn Leu Glu Asn Asp 

AAC AAA ACA GAA AAC CAA AAA ACC CCC AAC CAC CCC ATA AAA GAA GAT GAT TTA CAA GAA AGC CCA 
Asn Lys Thr Glu Asn Gin Lys Thr Pro Asn His Pro He Lys Glu Asp Asp Leu Gin Glu Ser Pro 

CAG GAA AAC CCA CAA AAA GAA AAT CAA AAA GAA AAT ATA GAA GAA AAA GAA AAT CTC AAA GAA GAA 
Gin Glu Asn Pro Gin Lys Glu Asn Gin Lys Glu Asn He Glu Glu Lys Glu Asn Leu Lys Glu Glu 

GAA AAA GAA ACG CAA AAC GCT CCA AAC TTT AGC CCA CTA ACC CCC ACA AAC GCT AAA AAA CCC GTT 
Glu Lys Glu Thr Gin Asn Ala Pro Asn Phe Ser Pro Leu Thr Pro Thr Asn Ala Lys Lys Pro Val 

ATG GTT AAA GAA TTG AGC GAA AAT AAA GAG ATA TTA GAC GGA TTG GAT TAT GGC GAA GTG CAA AAA 
Met Val Lys Glu Leu Ser Glu Asn Lys Glu He Leu Asp Gly Leu Asp Tyr Gly Glu Val Gin Lys 

MCC CAA GAT TAT GAG CTT CCC ACC ACG CAA TTA TTG AAT GCG GTT TGT TTG AAA GAA ACT TCT TTA 
? Gin Asp Tyr Glu Leu Pro Thr Thr Gin Leu Leu Asn Ala Val Cys Leu Lys Glu Thr Ser Leu 

GAC GAA AAC GAG ATT GAC CAA AAA ATT CAG GAT CTA TTG AGC AAA CTG CGC ACC TTT AAA ATT GAT 
Asp Glu Asn Glu He Asp Gin Lys He Gin Asp Leu Leu Ser Lys Leu Arg Thr Phe Lys He Asp 

GGC GAT ATT ATC CGC ACT TAT TCA GGC CCT ATT GTA ACC ACT TTT GAA TTC CGC CCA GCT CCT AGC 
Gly Asp He He Arg Thr Tyr Ser Gly Pro He Val Thr Thr Phe Glu Phe Arg Pro Ala Pro Ser 

GTT AAG GTG AGT CGT ATT TTA GGA TTG AGC GAT GAT TTA GCG ATG ACT TTA TGT GCT GAA TCC ATT 
Val Lys Val Ser Arg He Leu Gly Leu Ser Asp Asp Leu Ala Met Thr Leu Cys Ala Glu Ser He 

CGC ATT CAA GCC CCT ATT AAA GGT AAA GAT GTC GTT GGC ATT GAA ATC CCT AAC AGC CAA AGC CAA 
Arg He Gin Ala Pro He Lys Gly Lys Asp Val Val Gly He Glu He Pro Asn Ser Gin Ser Gin 

ATT ATT TAC TTG AGA GAA ATT TTA GAA AGC GAA TTG TTT CAA AAA TCC AGC TCG CCC TTA ACT CTA 
He He Tyr Leu Arg Glu He Leu Glu Ser Glu Leu Phe Gin Lys Ser Ser Ser Pro Leu Thr Leu 
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GCT TTA GGC AAA GAC ATT GTG GGT AAC CCT TTC ATC ACG GAT TTA AAA AAG CTC CCC CAT TTG CTC 
Ala Leu Gly Lys Asp lie Val Gly Asn Pro Phe lie Thr Asp Leu Lys Lys Leu Pro His Leu Leu 

ATC GCC G 
lie Ala 
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HPC050 

ATG AAA AAA CCC TAC AGA AAG ATT TCT GAT TAT GCG ATC GTG GGT GGT TTG AGT GCG TTA GTG ATG 
Met Lys Lys Pro Tyr Arg Lys He Ser Asp Tyr Ala He Val Gly Gly Leu Ser Ala Leu Val Met 

GTG AGC ATT GTG GGG TGT AAG AGC AAT GCC GAT GAC AAA CCC AAA GAG CAA AGC TCT TTA AGT CAA 
Val Ser He Val Gly Cys Lys Ser Asn Ala Asp Asp Lys Pro Lys Glu Gin Ser Ser Leu Ser Gin 

AGC GTT CAA AAA GGT GCG TTT GTG ATT TTA GAA GAG CAA AAG GAT AAA TCT TAC AAG GTT GTT GAA 
Ser Val Gin Lys Gly Ala Phe Val He Leu Glu Glu Gin Lys Asp Lys Ser Tyr Lys Val Val Glu 

GAA TAC CCC AGC TCA AGA ACC CAC ATC ATA GTG CGC GAT TTG CAA GGC AAT GAA CGC GTG TTG AGC 
Glu Tyr Pro Ser Ser Arg Thr His He He Val Arg Asp Leu Gin Gly Asn Glu Arg Val Leu Ser 

AAT GAA GAG ATT CAA AAG CTC ATT AAA GAA GAA GAG GCC AAA ATT GAT AAC GGC ACG AGC AAG CTT 
Asn Glu Glu He Gin Lys Leu He Lys Glu Glu Glu Ala Lys He Asp Asn Gly Thr Ser Lys Leu 

GTT CAA CCT AAT AAT GGA GGG AGT AAT GAA AGC TCA GGC TTT GGC TTG GGG AGT GCG ATT TTA GGG 
Val Gin Pro Asn Asn Gly Gly Ser Asn Glu Ser Ser Gly Phe Gly Leu Gly Ser Ala He Leu Gly 

AGC GCG GCG GGG GCG ATT TTA GGG AGT TAT ATT GGC AAT AAG CTT TTC AAT AAC CCT AAT TAT CAG 
Ser Ala Ala Gly Ala He Leu Gly Ser Tyr He Gly Asn Lys Leu Phe Asn Asn Pro Asn Tyr Gin 

CAA AAC GCC CAA CGG ACC TAC AAA TCC CCA CAA GCT TAC CAA CGC TCT CAA AAT TCC TTT TCT AAA 
Gin Asn Ala Gin Arg Thr Tyr Lys Ser Pro Gin Ala Tyr Gin Arg Ser Gin Asn Ser Phe Ser Lys 

AGC GCA CCC AGC GCT TCA AGC ATG GGA GGA GCG AGT AAG GGA CAG AGC GGG TTT TTT GGC TCT AGT 
Ser Ala Pro Ser Ala Ser Ser Met Gly Gly Ala Ser Lys Gly Gin Ser Gly Phe Phe Gly Ser Ser 

AGA CCT ACT AGT TCG CCT GCG GTA AGC TCT GGG ACA AGG GGC TTT AAC TCA TAA 
Arg Pro Thr Ser Ser Pro Ala Val Ser Ser Gly Thr Arg Gly Phe Asn Ser 

HPC056 

TTG TTT TTA GTC AAA MMM MTA GGC GTG ATA GTA GTG GTT TTA ATA GGC TTT CTA GCT TGC TCG CAA 
Met Phe Leu Val Lys ? ? Gly Val He Val Val Val Leu He Gly Phe Leu Ala Cys Ser Gin 

GAG AGG TTT ATC CAA TTG CAA AAA AAA GCC CAA GAG CAA GAA AAT GAC GGC TCT AAA CGC CCT AGC 
Glu Arg Phe He Gin Leu Gin Lys Lys Ala Gin Glu Gin Glu Asn Asp Gly Ser Lys Arg Pro Ser 

TAT GTG GAT TCG GAT TAT GAA GTC TTT AGC GAA ACG ATT TTT TTA CAA AAC ATG GTG TAT CAG CCT 
Tyr Val Asp Ser Asp Tyr Glu Val Phe Ser Glu Thr He Phe Leu Gin Asn Met Val Tyr Gin Pro 

ATA GAA GAA AGA GAT TCT TTC GCC CAA CTG ACT AAA GAT GGA GAC GAT TCT TTT AAC CCC GAA ACT 
He Glu Glu Arg Asp Ser Phe Ala Gin Leu Thr Lys Asp Gly Asp Asp Ser Phe Asn Pro Glu Thr 

TCG GTG ATT TTA TTG AAT GAG CCA AGC GAT AAC GAT ACA AAA AAC CCG CCC TTA TAC CCA AAT GAG 
Ser Val He Leu Leu Asn Glu Pro Ser Asp Asn Asp Thr Lys Asn Pro Pro Leu Tyr Pro Asn Glu 

TCT AAT ACT AAC ACT GCC AAT AAC GAT ACA AAA AAC CCG TTC CTT TAC AAA CCG AAA AGA AAA ACA 
Ser Asn Thr Asn Thr Ala Asn Asn Asp Thr Lys Asn Pro Phe Leu Tyr Lys Pro Lys Arg Lys Thr 

AAA AAT CCA AAA CTC ATT GAA TAT TCC CAA CAA AAT TTC TAC CCC CTA AAG GAT GGG GAT ATT ATC 
Lys Asn Pro Lys Leu He Glu Tyr Ser Gin Gin Asn Phe Tyr Pro Leu Lys Asp Gly Asp He He 

ATG AGT AAA GAA GGG GAT CAA TGG TTG GTA GAA ATC AAA TCC AAA GCC TTG AAG CGT TTT TTA AAA 
Met Ser Lys Glu Gly Asp Gin Trp Leu Val Glu He Lys Ser Lys Ala Leu Lys Arg Phe Leu Lys 

GAT CAA AAC GAT AAA GAT CGC CAG ATC CAA ACT TTT ACT TTT AAT GAC ACT AAA ACG CAA ATT GCG 
Asp Gin Asn Asp Lys Asp Arg Gin He Gin Thr Phe Thr Phe Asn Asp Thr Lys Thr Gin He Ala 

CAA TTT AAG GGC AAA ATT TCT TCG TAT GTT TAT ACC ACC AAT AAC AGC GAT TTG AGT TTA AGG CCT 
Gin Phe Lys Gly Lys He Ser Ser Tyr Val Tyr Thr Thr Asn Asn Ser Asp Leu Ser Leu Arg Pro 

TTT TAT GAA TCG TTT TTG TTA GAA AAA AAG AGC GAT GAT CTT TAT ATG ATA GGG GAT AAG GCT TTA 
Phe Tyr Glu Ser Phe Leu Leu Glu Lys Lys Ser Asp Asp Leu Tyr Met He Gly Asp Lys Ala Leu 

GAC GCC ATT GAG ATT TCA AAG TGT CAA ATG GTG TTA AAA AAG CAT TCA ACC GAT AAA TTA GAC AGC 
Asp Ala He Glu He Ser Lys Cys Gin Met Val Leu Lys Lys His Ser Thr Asp Lys Leu Asp Ser 

CAG CAT AAA GCC ATC AGT ATT GAT TTG GAC TTT AAA AAA GAG CGC TTT AAG AGC GAT ACG GAA CTT 
Gin His Lys Ala He Ser lie Asp Leu Asp Phe Lys Lys Glu Arg Phe Lys Ser Asp Thr Glu Leu 

TTT TTA GAA TGC CAA AGT TAG 
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ATG AAT TTT TTT AAA ATC CTT 
Met Asii Phe Phe Lys He Leu 

ATC CTT ATA GGC GCT CCT TTA 
lie Leu He Gly Ala Pro Leu 

ACG CAG CAA AAA ATC GCC CTT 
Thr Gin Gin Lys He Ala Leu 

GCG CAA AGC TCC AAC GAG TTA 
Ala Gin Ser Ser Asn Glu Leu 

TTA AAA GAA GAA AAA ATT TAT 
Leu Lys Glu Glu Lys lie Tyr 

CAG GTG CCT GTA ACG ATA GAT 
Gin Val Pro Val Thr He Asp 

AAT GCG GTG GTG GAG AGC ATC 
Asn Ala Val Val Glu Ser He 

GAA GAA GCT GAA TTA GGG ACA 
Glu Glu Ala Glu Leu Gly Thr 

GGG TAT TTG AAT TAC GCG CTC 
Gly Tyr Leu Asn Tyr Ala Leu 

AGC AGC ATG TTT ACT AGC TCT 
Ser Ser Met Phe Thr Ser Ser 

AGG CTG TGC GCA AGA CTC TTG 
Arg Leu Cys Ala Arg Leu Leu 

GCG CTG TTT TCT TTT TAT GGG 
Ala Leu Phe Ser Phe Tyr Gly 

ATA TTC ATG CTT GCA ACC TTG 
He Phe Met Leu Ala Thr Leu 

ACC ACT CAA ATC GTT TTG ATT 
Thr Thr Gin He Val Leu He 

GAA TCC TTG CCC TCT TAT TTG 
Glu Ser Leu Pro Ser Tyr Leu 

TTA GGG CGA TTG AAT CAA ATG 
Leu Gly Arg Leu Asn Gin Met 

GCG ATT TTT ATT GCG ACT TTT 
Ala He Phe He Ala Ser Phe 

AAC GCT TAA 
Asn Ala 



TTA ATG GAA TTA AGG GCT ATT 
Leu Met Glu Leu Arg Ala lie 

ATC TAT GGC TTG TTA TAC CCT 
He Tyr Gly Leu Leu Tyr Pro 

GTA GAT GAA GAC AAT TCC TTC 
Val Asp Glu Asp Asn Ser Phe 

GAA ATC GCT TTT TTT AGC CCC 
Glu He Ala Phe Phe Ser Pro 

GGG ATC TTG CAT ATC CCT TCG 
Gly lie Leu His He Pro Ser 

TTT TAT GCG AAT TCC AAT TAC 
Phe Tyr Ala Asn Ser Asn Tyr 

AAC GCT TTA AAT GAT GAG ATA 
Asn Ala Leu Asn Asp Glu He 

GAC GGG ATT AAA ATC AGG CCT 
Asp Gly He Lys He Arg Pro 

TCT AGC GTG TTT ATT TTC ATC 
Ser Ser Val Phe He Phe He 

AGG CGT TTG GAA TTA GCC CTT 
Arg Arg Leu Glu Leu Ala Leu 

GTG TTT ATG GCA GCG TTT AGC 
Val Phe Met Ala Ala Phe Ser 

ATC GAA CGG CAT GCG AGT GCT 
He Glu Arg His Ala Ser Ala 

AGT TTG GGG TCG TTT TTA GGC 
Ser Leu Gly Ser Phe Leu Gly 

TCT TCT TTG CCC TTG ATT TTT 
Ser Ser Leu Pro Leu He Phe 

CAG GTT TTC GTT CAA ATA GTG 
Gin Val Phe Val Gin He val 

CAT GCG GAA TTT ATA GAT GTT 
His Ala Glu Phe He Asp Val 

ATA GGG AGT GTC TTT AAA CTC 
He Gly Ser Val Phe Lys Leu 



GTT TCT CAT ATT GGC GTT TTA TTA 
Val Ser His He Gly Val Leu Leu 

TTG CCT TAT TTA AAA GAC ATC GTA 
Leu Pro Tyr Leu Lys Asp He Val 

CTT TCT AGG CAA TTA GCC TTC ATG 
Leu Ser Arg Gin Leu Ala Phe Met 

TCT ATG CTG GAA GCC AAA AAG CTT 
Ser Met Leu Glu Ala Lys Lys Leu 

TAT TTT GAA GCC AAT ATC CAT AAG 
Tyr Phe Glu Ala Asn He His Lys 

TTT TTG ATT TAT GGC ACC TTA GCG 
Phe Leu He Tyr Gly Thr Leu Ala 

AGA TTC AAA CGC AAC GCC CAA ATA 
Arg Phe Lys Arg Asn Ala Gin He 

ATC GCT TTG TAT AAC CCT AGT GAG 
lie Ala Leu Tyr Asn Pro Ser Glu 

TTA CAC CAG GTG ATG CTC ATT GCA 
Leu His Gin Val Met Leu He Ala 

TTA GAT AAA AAG CAA ATC GCT TTA 
Leu Asp Lys Lys Gin He Ala Leu 

GTT TTT GTT TTG TTG TAT TTT GGG 
Val Phe Val Leu Leu Tyr Phe Gly 

TTA ATG GTG TTT TTG AAT AGC TCC 
Leu Met Val Phe Leu Asn Ser Ser 

GCA TGG ATC AAA AAT GAA GCC CAC 
Ala Trp He Lys Asn Glu Ala His 

ATG ATG GGT TTT GTG TGG CCT TTT 
Met Met Gly Phe Val Trp Pro Phe 

CCT GCT TAT CAT GGG ATC AGT TTG 
Pro Ala Tyr His Gly He Ser Leu 

TCT GTC CAT TTT TAT GCG CTT ATT 
Ser Val His Phe Tyr Ala Leu He 

AGC TCT TTA AAG AAA GCT TGT GAA 
Ser Ser Leu Lys Lys Ala Cys Glu 
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GTG CGT TTG TTT AGA TTT GTG GGG TGG TAT 
Met Arg Leu Phe Arg Phe Val Gly Trp Tyr 

GAA TTG TTT TTT GTA GGC ATT GAC AGC TTG 
Glu Leu Phe Phe Val Gly lie Asp Ser Leu 

ATC ATT TTA TTT TTC ACC TAT GAT ATT TTA 
lie lie Leu Phe Phe Thr Tyr Asp lie Leu 

TTG GCG ATG GTT TTA TTT TAC ATC ACC TTC 
Leu Ala Met Val Leu Phe Tyr lie Thr Phe 

GGC TTT TCC AAA TGC CAG ATT TTA AGC CCT 
Gly Phe Ser Lys Cys Gin lie Leu Ser Pro 

GTG GGG TTG AAC GCG ACT CCT TTT GTG TAT 
Val Gly Leu Asn Ala Thr Pro Phe Val Tyr 

AAT TCT TTG AGC GTT TCA GAG CAT TTG TTA 
Asn Ser Leu Ser Val Ser Glu His Leu Leu 

ATT AAT CCC TTA TTG CAA AAA GCC CAA AAT 
lie Asn Pro Leu Leu Gin Lys Ala Gin Asn 

TCT TAT GCT GAA GCT AAA GAA GCT TTT TTT 
Ser Tyr Ala Glu Ala Lys Glu Ala Phe Phe 

TAT GAG ATG CCC TTA AAT TTT GAA CTG GGT 
Tyr Glu Met Pro Leu Asn Phe Glu Leu Gly 

AAA ACG CTC AAA AAT TTC CGC CCT AAA GTT 
Lys Thr Leu Lys Asn Phe Arg Pro Lys Val 

ATC ACA GAC GCT CTT TTA TCC TTG CAT GCT 
lie Thr Asp Ala Leu Leu Ser Leu His Ala 

TCG TTT TTG TAT GTG TTT GCG ATT TTG CCC 
Ser Phe Leu Tyr Val Phe Ala lie Leu Pro 

TTT TCG CCC AGT CTC GCC CGC TAT GAA AAC 
Phe Ser Pro Ser Leu Ala Arg Tyr Glu Asn 

CTC GTT GTT TGG GGG CTA TTC TTT GCT TTA 
Leu Val Val Trp Gly Leu Phe Phe Ala Leu 

ATA GGC GTT CTA TCG CCC TTT TTC GTA TTC 
He Gly Val Leu Ser Pro Phe Phe Val Phe 

AAG AGG TTG TAG 
Lys Arg Leu 



TAT TTC AAA TAC TTT TTA ATC GTG CTT TTG GCT TTG 
Tyr Phe Lys Tyr Phe Leu He Val Leu Leu Ala Leu 

AAA TAC GCC GAT AAA ATG CCT GAT TCT GCG AAC ATG 
Lys Tyr Ala Asp Lys Met Pro Asp Ser Ala Asn Met 

TTC GCC CTC AAT TAC ACC TTG CCC ATT TCC TTG CTT 
Phe Ala Leu Asn Tyr Thr Leu Pro He Ser Leu Leu 

ATT AAA TCC AAC CAA TAC ACC GCC CTG CTC TCC ATT 
He Lys Ser Asn Gin Tyr Thr Ala Leu Leu Ser He 

ATT TTT TTG ATT AGC TTA TTT TTC ACG GCT GTT TAT 
He Phe Leu He Ser Leu Phe Phe Thr Ala Val Tyr 

ATG GAA GAA AAA ACG CAA AAT TTA ATT TAT AAA GAC 
Met Glu Glu Lys Thr Gin Asn Leu He Tyr Lys Asp 

GTG AAA TAT AAC GAT GAT TAC GTG TAT TTT GAT AAG 
Val Lys Tyr Asn Asp Asp Tyr Val Tyr Phe Asp Lys 

ATC AAG GTT TTT CGC CTA AAA GAT AAG ACT TTG GAA 
He Lys Val Phe Arg Leu Lys Asp Lys Thr Leu Glu 

GAA GAC AAG TAT TGG ATC TTG CAT GAC ACT ACT ATC 
Glu Asp Lys Tyr Trp He Leu His Asp Thr Thr He 

GCA AAC GCT TTA AAC ACC ACG CGT TTA AAA ACC TTT 
Ala Asn Ala Leu Asn Thr Thr Arg Leu Lys Thr Phe 

TTA GAC ACC ATT TAT CAA AAC AAG CCT GCG GTT TCT 
Leu A3p Thr He Tyr Gin Asn Lys Pro Ala val Ser 

TTA GTG CGC CAA AAC GCG GAC ACG AAA AAA GTG CGC 
Leu Val Arg Gin Asn Ala Asp Thr Lys Lys Val Arg 

TTT TTT GTG CCG TTT TTA AGC GTT TTA ATC GCT TAT 
Phe Phe Val Pro Phe Leu Ser Val Leu He Ala Tyr 

CTG GCT CTT TTA GGG CTA AAG TTT ATC ATT ATC ACG 
Leu Ala Leu Leu Gly Leu Lys Phe He He He Thr 

GGG AAG TTC AGC ATT TCA GGG ATA CTC ATT CCT GAA 
Gly Lys Phe Ser He Ser Gly He Leu He Pro Glu 

TTA GCC CTC AGT CTT TGG TAT TTT AAA AAG CTT AAT 
Leu Ala Leu Ser Leu Trp Tyr Phe Lys Lys Leu Asn 
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ATG AAA AAA ACA ACC CTC TTT 
Met Lys Lys Thr Thr Leu Phe 

GTT CCT AAA ACC GAG CCT TCT 
Val Pro Lys Thr Glu Pro Ser 

GCT CAA AAA CTT TCT TTA AAA 
Ala Gin Lys Leu Ser Leu Lys 

CAA GAA TAC GCC ATT AAA AGA 
Gin Glu Tyr Ala lie Lys Arg 

ATT GAT TTG AGC GCT TTT TAT 
lie Asp Leu Ser Ala Phe Tyr 

CAA CCG GGC GTG CAA AAA GCC 
Gin Pro Gly Val Gin Lys Ala 

CCC CCT CAA GTC CTA ACC CCT 
Pro Pro Gin Val Leu Thr Pro 

TTG AGC AGC ACT TTA GAA GCC 
Leu Ser Ser Thr Leu Glu Ala 

ATT ATT TAT CCC CTT TAT ATG 
He He Tyr Pro Leu Tyr Met 

AAA GAC GCC AAT GAA GTG TAT 
Lys Asp Ala Asn Glu Val Tyr 

TAT GGC ATG GTG TTA AAC GCA 
Tyr Gly Met Val Leu Asn Ala 

CAT TTC CAA AAC GCT TTG AAA 
His Phe Gin Asn Ala Leu Lys 

CAA GTG GCT TAT GAT AAG GCC 
Gin Val Ala Tyr Asp Lys Ala 

CTC TCG TTC AAT TCT ATT TTA 
Leu Ser Phe Asn Ser He Leu 

ACC GAG AAA AAT CTG CCC GAT 
Thr Glu Lys Asn Leu Pro Asp 

AAG ACT TTA GAA AAT CAG GTT 
Lys Thr Leu Glu Asn Gin Val 

CCC CAA GTG ACT TTT TTT GGC 
Pro Gin Val Ser Phe Phe Gly 

CCT AGT TGG TTT GTG GGC GTM 
Pro Ser Trp Phe Val Gly ? 

TAC CAA GCG AGC AAA TTA GCG 
Tyr Gin Ala Ser Lys Leu Ala 

GAA TTG TTA GTG AAT AAG ACT 
Glu Leu Leu Val Asn Lys Thr 

TCT AGC GTG GAA TTA GCC AAG 
Ser Ser Val Glu Leu Ala Lys 

ACG AAC GCT CAA GTC ATT GAT 
Thr Asn Ala Gin Val He Asp 

GCT TAT AAA TAC ATC GTT TCA 
Ala Tyr Lys Tyr He Val Ser 

GAA TTT GTT TAT TAA 
Glu Phe Val Tyr 



GTA TTG GGC TTA TTA TTC AAT 
Val Leu Gly Leu Leu Phe Asn 

TCT TTG AAT TTG GCT GAA GAC 
Ser Leu Asn Leu Ala Glu Asp 

AAC GCA TGG AAT AGG GTG TTA 
Asn Ala Trp Asn Arg Val Leu 

GCG AGT AAA ATG AAA TTA GCG 
Ala Ser Lys Met Lys Leu Ala 

GTG TAC CTC TCT AAC CCT ATT 
Val Tyr Leu Ser Asn Pro He 

ACC AAC CAG ATC CAT CAA GGC 
Thr Asn Gin He His Gin Gly 

CAA ATC CAA GCG GGC ATG CAA 
Gin He Gin Ala Gly Met Gin 

CCC TTA TTG TTT TCT AAG CAA 
Pro Leu Leu Phe Ser Lys Gin 

GGT GGG GCA AGA TTC ACG ATG 
Gly Gly Ala Arg Phe Thr Met 

CGC TTG AAA AAG CTT TCC ACT 
Arg Leu Lys Lys Leu Ser Thr 

GAA GTG GCT GAA ACT TTA GAA 
Glu Val Ala Glu Thr Leu Glu 

ATG CAA AAA GTA GGG CAA ATC 
Met Gin Lys Val Gly Gin He 

CAT ATC GCT AGC GTT AAG GCT 
His He Ala Ser Val Lys Ala 

TCT AGC AAG GAC GAT TTA GCG 
Ser Ser Lys Asp Asp Leu Ala 

TTG AGC TTT TTT GTT TCT TCC 
Leu Ser Phe Phe Val Ser Ser 

CAA ATT TCT AAA GAA AAC ACG 
Gin lie Ser Lys Glu Asn Thr 

TCT TAT ATC ATG AAG CAA AAC 
Ser Tyr He Met Lys Gin Asn 

GCT GGG CGC ATG CST ATT CTT 
Ala Gly Arg Met ? He Leu 

GAG TTG CAA GCT AAT AGC GAA 
Glu Leu Gin Ala Asn Ser Glu 

TAT AAA GAG ACG CTT TCT TAT 
Tyr Lys Glu Thr Leu Ser Tyr 

GAA AAC TTA AAA CTC CAA GAG 
Glu Asn Leu Lys Leu Gin Glu 

GCG AGG AAC ACG CTT TCT TCT 
Ala Arg Asn Thr Leu Ser Ser 

TTA GCG AAT TTA ATG GCG TTA 
Leu Ala Asn Leu Met Ala Leu 



AGC TCT TTA AGC GCT GTT GAT GGA 
Ser Ser Leu Ser Ala Val Asp Gly 

AGC ACA CCC TTG AAC CAT TCT AAC 
Ser Thr Pro Leu Asn His Ser Asn 

TCC AAC CAT GAA GGC TTG CAT GCG 
Ser Asn His Glu Gly Leu His Ala 

GCT AAG CTT TCT TTT TTG CCT CAA 
Ala Lys Leu Ser Phe Leu Pro Gin 

AAA ATG GAT TTT GCC AGC CAA AAA 
Lys Met Asp Phe Ala Ser Gin Lys 

TTG CAA AGC ATT CAG CAA AAT ATC 
Leu Gin Ser He Gin Gin Asn He 

GGG GTG ATG CAA GGG TTT GGG GCT 
Gly Val Met Gin Gly Phe Gly Ala 

AAT GTG GTG ATT GGG GCT TTG AGC 
Asn Val val He Gly Ala Leu Ser 

GTG CGC ATT GCG GAT TTG ATG CAA 
Val Arg He Ala Asp Leu Met Gin 

TTT CAA GAG CTT GTG AGC GTG TAT 
Phe Gin Glu Leu Val Ser Val Tyr 

GAG GTA GAA AAA GGC CAT TAT AAG 
Glu Val Glu Lys Gly His Tyr Lys 

GCT AGG GTA GAA ACC TTA GGC GCT 
Ala Arg Val Glu Thr Leu Gly Ala 

AAA GAC GTG TTA GAA GTT TCG CAA 
Lys Asp Val Leu Glu Val Ser Gin 

CCT TCA AGC AAA TTA GAG ATC CAC 
Pro Ser Ser Lys Leu Glu lie. His 

ACG CTC AAT TCC TAC CCG GCT TTA 
Thr Leu Asn Ser Tyr Pro Ala Leu 

AAA CTA CAG ATC GCT AAA TTC TTG 
Lys Leu Gin He Ala Lys Phe Leu 

AAT TCG GTG TTT GAA GAC ATG ATC 
Asn Ser Val Phe Glu Asp Met He 

TCT CCC ACA GGG CGT ATC CAA AAA 
Ser Pro Thr Gly Arg He Gin Lys 

CAA ATC CAA GCT AAA AAA AAC ATG 
Gin He Gin Ala Lys Lys Asn Met 

TTG AAA GAA TAC AAA AGC TTG CTT 
Leu Lys Glu Tyr Lys Ser Leu Leu 

CAG GCT TTT TTA CAA GGC TTA AGC 
Gin Ala Phe Leu Gin Gly Leu Ser 

ATC ATC GTG GAG CAA AAA AGC GTG 
He He Val Glu Gin Lys Ser Val 

AGC GAT CAT ATT GAT TTA TTT TAT 
Ser Asp His He Asp Leu Phe Tyr 
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ATG GTG TTA GTT AAA ATG GTG TTA GGG TTT TTG ATC CTT TTA AGC CCT TTG TAC GCT ACT GGA TTG 
Met Val Leu Val Lys Met Val Leu Gly Phe Leu He Leu Leu Ser Pro Leu Tyr Ala Thr Gly Leu 

GAT ATT VMA CAA ACG GAC ATT ATA GAG CGT TCT TTA AAT TTC CTC TTA TTT GCG GGG ATT TTG TGG 
Asp He ? Gin Thr Aap He He Glu Arg Ser Leu Asn Phe Leu Leu Phe Ala Gly He Leu Trp 

TAT TTT TTG GCT AAA AAA CTG CGT TCA TTT TTA CGC TCC AAA AGC CTT GAA ATC TCC AAA CGA TTA 
Tyr Phe Leu Ala Lys Lys Leu Arg Ser Phe Leu Arg Ser Lys Ser Leu Glu He Ser Lys Arg Leu 

GAA GAG ATT CAA GCC CAA CTC AAA GTG AGT AAA GAA AAT AAG AAA AAA CTC TTA AAA GAA TTA GAG 
Glu Glu He Gin Ala Gin Leu Lys Val Ser Lys Glu Asn Lys Lys Lys Leu Leu Lys Glu Leu Glu 

CAA GCC AAA GAA AAA GCT GAA TTA ATT ATT TCT GAT GCG AAT AAA GAA GCT TAC ACG ATC ACG CAA 
Gin Ala Lys Glu Lys Ala Glu Leu He He Ser Asp Ala Asn Lys Glu Ala Tyr Thr He Thr Gin 

AAA TAC GAA TTG CAA ACC AAA ATG GAT GTG GAA AAT TTG ATC AAA AAT TCT AAG GCG TTG ATG GAT 
Lys Tyr Glu Leu Gin Thr Lys Met Asp Val Glu Asn Leu He Lys Asn Ser Lys Ala Leu Met Asp 

TTA GAA GTT AAA AAG ATC AAA AGA GAG CTG GTT GAR AGC GTT TTT RAA GAT CTA AGA GAG AGC AAA 
Leu Glu Val Lys Lys He Lys Arg Glu Leu Val ? Ser Val Phe ? Asp Leu Arg Glu Ser Lys 

AHA GTC TCT TTC AAT GCG CAA GAT TGC GTG AAT ATT TTG AVA CAV AGG CTT TAA 
? Val Ser Phe Asn Ala Gin Asp Cys Val Asn He Leu ? ? Arg Leu 

HPC070 

ATG CTC GCT TCC ATT ATT GAA TTT TCC TTA CGC CAG CGA ATA ATC GTG ATT GTT GGC GCG ATT CTT 
Met Leu Ala Ser He He Glu Phe Ser Leu Arg Gin Arg He He Val He Val Gly Ala He Leu 

ATT TTG TTT TTT GGG ACT TAT AGT TTT ATC CAC ACT CCA GTA GAT GCT TTC CCG GAT ATT TCG CCC 
He Leu Phe Phe Gly Thr Tyr Ser Phe He His Thr Pro Val Asp Ala Phe Pro Asp He Ser Pro 

ACT CAA GTC AAA ATC ATT TTA AAA CTC CCC GGT TCT AGC CCT GAA GAA ATG GAA AAT AAC ATC GTG 
Thr Gin Val Lys He He Leu Lys Leu Pro Gly Ser Ser Pro Glu Glu Met Glu Asn Asn He Val 

CGC CCT TTA GAA TTG GAG CTT TTA GGC TTG AAA GGG CAA AAA TCT TTA AGA AGT ATT TCA AAA TAT 
Arg Pro Leu Glu Leu Glu Leu Leu Gly Leu Lys Gly Gin Lys Ser Leu Arg Ser He Ser Lys Tyr 

TCT ATT TCA GAC ATC ACG ATA GAT TTT GAT GAC AGC GTG GAT ATT TAT TTA GCG AGA AAC ATT GTT 
Ser He Ser Asp He Thr He Asp Phe Asp Asp Ser Val Asp He Tyr Leu Ala Arg Asn He Val 

AAT GAG CGC TTG AGC AGC GTG ATG AAA GAT TTA CCC GTG GGG GTT GAA GGG GGC ATG GCG CCC ATT 
Asn Glu Arg Leu Ser Ser Val Met Lys Asp Leu Pro Val Gly Val Glu Gly Gly Met Ala Pro He 

GTT ACG CCG CTA TCA GAT ATC TTT ATG TTC ACT ATT GAT GGC AAT ATC ACT GAG ATA GAA AAA CGA 
Val Thr Pro Leu Ser Asp He Phe Met Phe Thr He Asp Gly Asn lie Thr Glu He Glu Lys Arg 

CAG CTT TTA GAC TTT GTG ATC CGC CCG CAA TTA AGA ATG ATT AGC GGC GTG GCG GAT GTC AAT TCT 
Gin Leu Leu Asp Phe Val He Arg Pro Gin Leu Arg Met He Ser Gly Val Ala Asp Val Asn Ser 

ATT GGA GGC TTT AGC AGG GCG TTT TGT GAT CGT GCC G 
He Gly Gly Phe Ser Arg Ala Phe Cys Asp Arg Ala 
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ATG GCT GAA AAT TCT TTC AAA AAT GTT TCC ACA 
Met Ala Glu Asn Ser Phe Lys Asn Val Ser Thr 

ACC CTG TTT CTT TTA GGA GGC GTT TTT AGC GCG 
Thr Leu Phe Leu Leu Gly Gly Val Phe Ser Ala 

AAT TAC ACT AAT TCA ATG GAC CAT GCG ATT TTT 
Asn Tyr Thr Asn Ser Met Asp His Ala lie Phe 

TTA GAT CAA ACG CTC CGA CGC GTT GTT TTT TTA 
Leu Asp Gin Thr Leu Arg Arg Val Val Phe Leu 

TTA GTG GGG GTG TTT TTA AGC TTG TAT CGT AAA 
Leu Val Gly Val Phe Leu Ser Leu Tyr Arg Lys 

GTG ATC TTA TTT GAA GCC CTT TTA GAA TCT TTA 
Val lie Leu Phe Glu Ala Leu Leu Glu Ser Leu 

TCG CAC AGC GCT AAT TTC CCT AGC ACT ATC GCG 
Ser His Ser Ala Asn Phe Pro Ser Thr lie Ala 

TTA TTA ATA CCC CAT TTG ATC ACG CAT CAA ATA 
Leu Leu lie Pro His Leu lie Thr His Gin He 

TTG ATT CTT TTA ATT GGG TTA GCG CTG ATT GTT 
Leu He Leu Leu He Gly Leu Ala Leu He Val 

TTT TGT TTA GGG GCG TCA GGG GCT TGT TTT TCC 
Phe Cys Leu Gly Ala Ser Gly Ala Cys Phe Ser 

TAA 



CAA CCC AAA CCA TTT TTC TTA TTA CCA GTT AAA 
Gin Pro Lys Pro Phe Phe Leu Leu Pro Val Lys 

TTT TTT ATC CTT GTT GCT GGC TTG GTT TTT TTT 
Phe Phe He Leu Val Ala Gly Leu Val Phe Phe 

AAC TTG ATG CGT TCA AAC TCT TCT AAC CCT ATT 
Asn Leu Met Arg Ser Asn Ser Ser Asn Pro He 

GGC TCT TCT CAA TTC GTG TTG CCT TTG AGC TTG 
Gly Ser Ser Gin Phe Val Leu Pro Leu Ser Leu 

AAT TTA GGA CTT GGG GTG TGG TTT GTG CTA AGC 
Asn Leu Ala Leu Gly Val Trp Phe Val Leu Ser 

AAA CAC CTT TTG GGA CAC TCC ATT CAA TGG TTT 
Lys His Leu Leu Ala His Ser He Gin Trp Phe 

CTT TCT TTG ACG CAT TTT TAT GGG TTG CTT GTT 
Leu Ser Leu Thr His Phe Tyr Gly Leu Leu Val 

TTT CAA AAC ATT CTT CCT TAT AGT TTG CTT GKT 
Phe Gin Asn He Leu Pro Tyr Ser Leu Leu ? 

TTA GGG GTG TCT TTT AGC AGT GTT TTA GGA GGG 
Leu Gly Val Ser Phe Ser Ser Val Leu Gly Gly 

ATA GGG ATT TAT TTG AGC GTG TTT CAA AAG ATC 
He Gly He Tyr Leu Ser Val Phe Gin Lys He 



HPC091 

ATG GGT AAT CAT TTT TCT AAA TTA GGA TTT GTT 
Met Gly Asn His Phe Ser Lys Leu Gly Phe Val 

CAT ATC TGG CGT TTC CCC TAC ATG ACT GGG GTG 
His He Trp Arg Phe Pro Tyr Met Thr Gly Val 

TTT TTA TCT TTA AGC GTT GGC GCG GCG ATG TTT 
Phe Leu Ser Leu Ser Val Gly Ala Ala Met Phe 

AAA AAT GTA ATA GAA GCC TTT AAA GAG CTT GAC 
Lys Asn Val He Glu Ala Phe Lys Glu Leu Asp 

ATT TTG CTT ATT TCT GGG CCA TTA ATA CTG ACT 
He Leu Leu He Ser Gly Pro Leu He Leu Thr 

TAT TTG GTG AGT GTT AGT TTT AAT TTG CCT AAC 
Tyr Leu Val Ser Val Ser Phe Asn Leu Pro Asn 

ACT TTG CAG TCT ATA GGG TTA CAA TCC ATA GGG 
Thr Leu Gin Ser He Gly Leu Gin Ser He Gly 



TTA GCC GCA TTA GGG AGC GCG ATA GGT TTA GGG 
Leu Ala Ala Leu Gly Ser Ala He Gly Leu Gly 

AGT GGT GGG GGT GCT TTT GTT TTA TTG TTT TTA 
Ser Gly Gly Gly Ala Phe Val Leu Leu Phe Leu 

ATC GCT GAA ATG CTA TTA GGG CAA AGC ACG CAA 
He Ala Glu Met Leu Leu Gly Gin Ser Thr Gin 

CTT AAC CCT AAA AAA CGC TGG AAA TAC GCA GGG 
Leu Asn Pro Lys Lys Arg Trp Lys Tyr Ala Gly 

TTT TAC GGC ACG ATT TTA GGC TGG GTG CTT TAT 
Phe Tyr Gly Thr He Leu Gly Trp Val Leu Tyr 

AAT ATC CAA GAA TCT GAA CAA ATT TTT ACT CAA 
Asn He Gin Glu Ser Glu Gin He Phe Thr Gin 

CTT TTG AGC GTT TTA TTG ATA ACC G 
Leu Leu Ser Val Leu Leu He Thr 
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HPC094 

ATG AAA AAG ATT ATT CTT GCA TGC CTT ATG 
Met Lys Lys lie lie Leu Ala Cys Leu Met 

TGG TAT AGC AAG GCC TAT AAC AAA ACA AAC 
Trp Tyr Ser Lys Ala Tyr Asn Lys Thr Asn 

ACT TCT AAA GAG GCT TCT AAA CAA AAA GCG 
Thr Ser Lys Glu Ala Ser Lys Gin Lys Ala 

AAT TCC CAG ATC CAT ATC CAA AAA AGT CGT 
Asn Ser Gin lie His lie Gin Lys Ser Arg 

ATT AAC TTA AAA ACC GAT GAC TTG GAA TTG 
lie Asn Leu Lys Thr Asp Asp Leu Glu Leu 

GGG ATC TAC TAC ACC AGA GTA AGG ATT AAT 
Gly lie Tyr Tyr Thr Arg Val Arg lie Asn 

AAC GCT CTT TAT GGG CAG TTT TCC ACC TTA 
Asn Ala Leu Tyr Gly Gin Phe Ser Thr Leu 

TCT AAA AGC ATG GGG GAT TTA TTG GCT AAA 
Ser Lys Ser Met Gly Asp Leu Leu Ala Lys 

GTC CCG GTG AGT TCG TTA GAA AAT TAT GAA 
Val Pro Val Ser Ser Leu Glu Asn Tyr Glu 

CAA ATC ACT TTT GAT AAC AAC AGC GAT ACA 
Gin lie Thr Phe Asp Asn Asn Ser Asp Thr 

TAT GCC AGA GTG CTA ACC CCT AGC GAT GAA 
Tyr Ala Arg Val Leu Thr Pro Ser Asp Glu 

GAC AGC GCT AAT GGC ATC ACA CGC ATT AGA 
Asp Ser Ala Asn Gly lie Thr Arg lie Arg 

GTA TTG AAT AGA AGC CTT GAA GTG GAT GAA 
Val Leu Asn Arg Ser Leu Glu Val Asp Glu 

TTG CTT TAT AAA GAA TTG AAA GAT TAT GCC 
Leu Leu Tyr Lys Glu Leu Lys Asp Tyr Ala 



82 



GCT TTT GTG GGT GCC AAT TTA AGC GCA GAG CCT AAG 
Ala Phe Val Gly Ala Asn Leu Ser Ala Glu Pro Lys 

ACC CAA AAA GGC TAT CTT TAT GGG AGT GGT TCA GCC 
Thr Gin Lys Gly Tyr Leu Tyr Gly Ser Gly Ser Ala 

TTA GCG GAT TTA GTG GCG TCT ATT AGC GTG GTG GTT 
Leu Ala Asp Leu Val Ala Ser lie Ser Val Val Val 

GTG GAT AAT AAG TTA AAA TCC AGT GAT TCG CAA ACG 
Val Asp Asn Lys Leu Lys Ser Ser Asp Ser Gin Thr 

AAT AAT GTA GAA ATT GTC AAT CAA GAA GCG CAA AAA 
Asn Asn Val Glu lie Val Asn Gin Glu Ala Gin Lys 

CAA AAC TTG TTT TTG CAG GGT TTA AGG GAT AAG TAT 
Gin Asn Leu Phe Leu Gin Gly Leu Arg Asp Lys Tyr 

ATG CCT AAG GTT TGT AAA GGG GTT TTT TTA CAG CAA 
Met Pro Lys Val Cys Lys Gly Val Phe Leu Gin Gin 

GCG ATG CCT ATA GAA AGG ATT TTA AAA GCG TAT TCT 
Ala Met Pro lie Glu Arg lie Leu Lys Ala Tyr Ser 

AAA ATC TAT TAT CAA AAC GCT TTC AAA CCT AAA GTG 
Lys lie Tyr Tyr Gin Asn Ala Phe Lys Pro Lys Val 

GAG GAT ACA GAG ATT AAA AAC GCT CTC ATA AGT GCT 
Glu Asp Thr Glu He Lys Asn Ala Leu He Ser Ala 

GAA AAA CTC TAT CAA ATC AAA AAT GAA GTT TTC ACA 
Glu Lys Leu Tyr Gin He Lys Asn Glu Val Phe Thr 

GTG GTT GTT AGC GCA AGC GAT TGT CAA GGC ACG CCT 
Val Val Val Ser Ala Ser Asp Cys Gin Gly Thr Pro 

AAG AAT AAG AAT TTT GCT ATC ACG CGC TTG CAA TCT 
Lys Asn Lys Asn Phe Ala He Thr Arg Leu Gin Ser 

AAT AAA GAA GGG CAA GGC AAT ACG GGG TTA TAA 
Asn Lys Glu Gly Gin Gly Asn Thr Gly Leu 
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ATG GCA TTA AGG GTA TTG TTA TTC TTT TGT TTT TTG TTT TTA CAA GCA GAA GAT AAA AGC CAA GAG 
Met Ala Leu Arg Val Leu Leu Phe Phe Cys Phe Leu Phe Leu Gin Ala Glu Asp Lys Ser Gin Glu 

CTA TTG TCC ATA CAA AAA GAA ATG GCT TTG GTG GAT AAA AAA CTC GCC AAA GAC GAT AAC GTG TGG 
Leu Leu Ser lie Gin Lys Gin Met Ala Leu Val Asp Lys Lys Leu Ala Lys Asp Asp Asn Val Trp 

TTG AAA AAA TTT GAA AAC TAT AAG ATC TAC AAC CAA ATT TAT ACC GAA AAA GAG AGC GTG AGG CAG 
Leu Lys Lys Phe Glu Asn Tyr Lys lie Tyr Asn Gin lie Tyr Thr Glu Lys Glu Ser Val Arg Gin 

GAA TTA AGG CGT TTA AAA AAT AAA AAA AGC AAG GAT TTA TTA AAG ATT AGC ACC TTA GAG CAC ACC 
Glu Leu Arg Arg Leu Lys Asn Lys Lys Ser Lys Asp Leu Leu Lys lie Ser Thr Leu Glu His Thr 

TTA AAG GCT TTA GAA TCC CAG CAA AAA ATG TTT GAA AGC TAT GGG GTC AAT CCT TTT AAG GAT TTG 
Leu Lys Ala Leu Glu Ser Gin Gin Lys Met Phe Glu Ser Tyr Gly Val Asn Pro Phe Lys Asp Leu 

ATA GAG CGC CCC AAT ATC CCC AAT ATC CCT AAT ATC GCT AAC CCT ATT GCA ATC ATT GAT GGC ATT 
lie Glu Arg Pro Asn lie Pro Asn lie Pro Asn He Ala Asn Pro He Ala He He Asp Gly He 

TCT TTC ATT AAA AGC ATG CAT TTA AAG CAT GAA AGT CTT AAA AAA AAC CAA ACT TCT TTA GAA GAA 
Ser Phe He Lys Ser Met His Leu Lys His Glu Ser Leu Lys Lys Asn Gin Thr Ser Leu Glu Glu 

GTT TTA AAG CTT CTA GAT CAA AAA CAC CAG CTT TTA AAT GAG TGG CAC GCC TTG GAT AAA AGC GTG 
Val Leu Lys Leu Leu Asp Gin Lys His Gin Leu Leu Asn Glu Trp His Ala Leu Asp Lys Ser Val 

AAA CTA AGC GAT GAG ATT TAT CAA ACT CAA GCC AAA CGC TTA GAA TTG CAA GGG GCT CAA AAC ATT 
Lys Leu Ser Asp Glu He Tyr Gin Thr Gin Ala Lys Arg Leu Glu Leu Gin Gly Ala Gin Asn He 

TTA AAA ACC ACG ATT GGG ATT TTC CAA AAA GAC AGC GAT GAA GCT ATA AGC ATT GTT AAA TCT CAA 
Leu Lys Thr Thr He Gly He Phe Gin Lys Asp Ser Asp Glu Ala He Ser He Val Lys Ser Gin 

GTT AAA AAC CAG CTT TTT AAA TTG ATT TAT GTG TTT TTA GCA GCC CTT TTG AGC GTG GTG TTT GCT 
Val Lys Asn Gin Leu Phe Lys Leu He Tyr Val Phe Leu Ala Ala Leu Leu Ser Val Val Phe Ala 

TGG ATT TTA AAA ATC ATT TCC AGT AAA TAC ATT GAA AAT AAT GAG CGC GTC TAT ACC GTG AAT AAA 
Trp He Leu Lys He He Ser Ser Lys Tyr He Glu Asn Asn Glu Arg Val Tyr Thr Val Asn Lys 

GCC ATT AAC TTC GTG AAT GTG AGC GTG ATC ATT TTA ATC TTT CTT TTT TCT TAT TTA GAG AAT GTT 
Ala He Asn Phe Val Asn Val Ser Val He He Leu He Phe Leu Phe Ser Tyr Leu Glu Asn Val 

ACT TAC TTG GTC ACG GTT TTA GGC TTT GCG AGC GCT GGC TTA GCG ATT GCG ATG AAA GAT TTA . TTC 
Thr Tyr Leu Val Thr Val Leu Gly Phe Ala Ser Ala Gly Leu Ala He Ala Met Lys Asp Leu Phe 

ATG AGC TTG CTC GGG TGG TTT ATT ATT TTG ATT GGG GGG AGC GTG CAT GTG GGC GAT AGG GTG CGT 
Met Ser Leu Leu Gly Trp Phe He He Leu He Gly Gly Ser Val His Val Gly Asp Arg Val Arg 

ATC GCT AAG GGG ACG GAT ATT TTT ATT GGC GAT GTG TTG GAT ATT TCT ATG TTG CAC ATT ACG ATT 
He Ala Lys Gly Thr Asp He Phe He Gly Asp Val Leu Asp He Ser Met Leu His He Thr He 

TTA GAA GAT GTA ACC TTT ACC ACT TAC ACG AAC AAC AGG AGA GCG GGC CGG ATT ATT TTT GTG CCT 
Leu Glu Asp Val Thr Phe Thr Thr Tyr Thr Asn Asn Arg Arg Ala Gly Arg He He Phe Val Pro 

AAT AAT TAT ATT TTC ACC ACC ATG TTT GCT AAT TAC AGC CAT TTT GGG ATG AAA ACG GTT TGG GAT 
Asn Asn Tyr He Phe Thr Thr Met Phe Ala Asn Tyr Ser His Phe Gly Met Lys Thr Val Trp Asp 

GGC GTG GAT TTT TGC GTT ACA TTT GAT TCT GAT TTT AAA AAA GCT TCT AAA ATT GCG CTC AAT ATC 
Gly Val Asp Phe Cys Val Thr Phe Asp Ser Asp Phe Lys Lys Ala Ser Lys He Ala Leu Asn He 

GCT ACG GAA TTG TCT AAA GAA TAC ACG GAT ATT ACC TAT AAA CAG CTC AAT AAA ATG CGC GAC CGG 
Ala Thr Glu Leu Ser Lys Glu Tyr Thr Asp He Thr Tyr Lys Gin Leu Asn Lys Met Arg Asp Arg 

TAT TCT TTA AGG AGT TTG AGT GTG AAG CCT CGA TGC TTT TTG ATG CCT GAA AAT AAC GGG ATA AAA 
Tyr Ser Leu Arg Ser Leu Ser Val Lys Pro Arg Cys Phe Leu Met Pro Glu Asn Asn Gly He Lys 

ATC TCG GTG TGG TAT CAA ACC AAT TCG TAT GCG ACC ATG TCT TTA AGG AGC AAG ATT GTG GCT GAA 
He Ser Val Trp Tyr Gin Thr Asn Ser Tyr Ala Thr Met Ser Leu Arg Ser Lys He Val Ala Glu 

ATC GTT GAA GCT TTT TTG AAA GAA GAA AAT ATC CAT ATC GCT TAT ACG ACC AGC AAG TTG CTT AAA 
He val Glu Ala Phe Leu Lys Glu Glu Asn He His He Ala Tyr Thr Thr Ser Lys Leu Leu Lys 

GTG GAT GCT GAT TTT TTA GGC GAT GGT TTT GGG AAT AAA AGG GAA CAA AAA TGA 
Val Asp Ala Asp Phe Leu Gly Asp Gly Phe Gly Asn Lys Arg Glu Gin Lys 
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ATG CCG GAA AAT TCT AAA CTA CAA CCT GCT 
Met Pro Glu Asn Ser Lys Leu Gin Pro Ala 

AAC AGG AAT TTT TTC TTT TCT CTC ATT CTG 
Asn Arg Asn Phe Phe Phe Ser Leu lie Leu 

GAA CAC AGA GAA GAT TTT TTT CCT TCA AAA 
Glu His Arg Glu Asp Phe Phe Pro Ser Lys 

GTT TTA AAA AGA GGC CAT TCG CAA GAT CCC 
Val Leu Lys Arg Gly His Ser Gin Asp Pro 

GCT GGC CCC CAA AAA CCC CCC ACT CCA CCC 
Ala Gly Pro Gin Lys Pro Pro Thr Pro Pro 

GAA AAG CCT AAA CCT GAG CCT AAA CCT AAG 
Glu Lys Pro Lys Pro Glu Pro Lys Pro Lys 

AAG GCT CTT AAA AAA GTG GAA AAA GTG GAA 
Lys Ala Leu Lys Lys Val Glu Lys Val Glu 

AAA ATC GTA GAG CAG AAA GTA GAA CAA AAA 
Lys lie Val Glu Gin Lys Val Glu Gin Lys 

AAA AAA GAA TTT GAC CCT AAC CAG CTT TCT 
Lys Lys Glu Phe Asp Pro Asn Gin Leu Ser 

AAT AAT AAA GGC TTA GAT AAC CAA ACC AGA 
Asn Asn Lys Gly Leu Asp Asn Gin Thr Arg 

GAT TTA GGC ACA GCC GAA AAA GAT TTC ATC 
Asp Leu Gly Thr Ala Glu Lys Asp Phe lie 

AAA TAT TTA GAA TAC CCT CAA GTA GCG GCT 
Lys Tyr Leu Glu Tyr Pro Gin Val Ala Ala 

TAC TTG CAC CCT AAC GGC GAT ATT ACC GAT 
Tyr Leu His Pro Asn Gly Asp lie Thr Asp 

GAT GAC AAC ACT TTA AAG ACC ATT CAG ATC 
Asp Asp Asn Thr Leu Lys Thr lie Gin lie 

CTC ATT CGC ATC AGA GTG CGT TAT TAC TTG 
Leu He Arg He Arg Val Arg Tyr Tyr Leu 



AAG TTA GGG AAA AAT TTT GAC CCT GTG GAT CAT TCT 
Lys Leu Gly Lys Asn Phe Asp Pro Val Asp His Ser 

TCT GTA TTG TTA CAC TGG TTG ATT TAT TTT TTA TTT 
Ser Val Leu Leu His Trp Leu He Tyr Phe Leu Phe 

CCC AAG CTT GTT AAA TTA AAT CCT GAA AAT TTA TTG 
Pro Lys Leu Val Lys Leu Asn Pro Glu Asn Leu Leu 

AGT AAA AAC ACC CAG GGC GCT CCT AAA CCC ACG CTG 
Ser Lys Asn Thr Gin Gly Ala Pro Lys Pro Thr Leu 

ACA CCC CCA ATT CCG CCA ACC CCG CCA AAA CCT ATA 
Thr Pro Pro He Pro Pro Thr Pro Pro Lys Pro He 

CCA AAA CCA GAA CCC AAA AAG CCC AAC CAC AAA CAT 
Pro Lys Pro Glu Pro Lys Lys Pro Asn His Lys His 

GAG AAA AAA ATA GTA GAG GAG AAA AAA GAA GAG AAA 
Glu Lys Lys He Val Glu Glu Lys Lys Glu Glu Lys 

GTA GAG CAG AAA AAA ATA GAA GAG AAA AAA CCT GTC 
Val Glu Gin Lys Lys He Glu Glu Lys Lys Pro Val 

TTC TTG CCT AAA GAA GTT GCG CCA CCC AGA AAA GAA 
Phe Leu Pro Lys Glu Val Ala Pro Pro Arg Lys Glu 

AGG GAT ATT GAT GAA TTG TAT GGC GAA GAA TTT GGG 
Arg Asp He Asp Glu Leu Tyr Gly Glu Glu Phe Gly 

AGG AAT AAT TTA AGG GAT ATT GGG CGC ATC ACG CAA 
Arg Asn Asn Leu Arg Asp He Gly Arg He Thr Gin 

TAT TTA GGG CAG GAC GGG ACG AAT GCG GTA GAG TTT 
Tyr Leu Gly Gin Asp Gly Thr Asn Ala Val Glu Phe 

CTT AAA ATC ATC ATT GGC TCT GAA TAT AAA ATG CTT 
Leu Lys He He He Gly Ser Glu Tyr Lys Met Leu 

GCT TAT AAG GAT TAC CCA CGC CCT AAA ACT AAA ACC 
Ala Tyr Lys Asp Tyr Pro Arg Pro Lys Thr Lys Thr 

GGA GGC AAT TAA 
Gly Gly Asn 
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ATG AAA ACA AAC GGG CTT TTT AAA ATG TGG GGG 
Met Lys Thr Asn Gly Leu Phe Lys Met Trp Gly 

GCA TGC TCT GAT AGC CAT AAA GAA AAA AAG GAC 
Ala Cys Ser Asp Ser His Ly3 Glu Lys Lys Asp 

AAA GTG GGG GTT TTT AGC GAT AAG CCT CCT TTT 
Lys Val Gly Val Phe Ser Asp Lys Pro Pro Phe 

TAT GAT GTG ATC ATC GCT AAA CGC ATG GCC CTT 
Tyr Asp Val lie lie Ala Lys Arg Met Ala Leu 

ATT CCC GTA GAA GCT TCA GCT AGG GTG GAA TTT 
lie Pro Val Glu Ala Ser Ala Arg Val Glu Phe 

AAT TTC ACG CGC ACT AAA GAA AGA GAA AAA GTC 
Asn Phe Thr Arg Thr Lys Glu Arg Glu Lys Val 

TKG GGG GTG ATT TCT AAA GAT GGG GTC ATT AAA 
? Gly Val lie Ser Lys Asp Gly Val lie Lys 

GTG AAT AAA GGC ACG ACA GCG GAW TTT TAT TTC 
Val Asn Lys Gly Thr Thr Ala ? Phe Tyr Phe 

TTT GTA CAA AAC ACA GAG ACT TTT TTA GCC CTT 
Phe Val Gin Asn Thr Glu Thr Phe Leu Ala Leu 

AAC ACT TTA TTG CTC GCT TGG GCG AAA CAA CAC 
Asn Thr Leu Leu Leu Ala Trp Ala Lys Gin His 

GAT AAA GAT GTG ATC GCT CCA GCG ATT AAA AAA 
Asp Lys Asp Val He Ala Pro Ala He Lys Lys 

GAG ATT GAT TCC CTC ATT TCT AGC GAC TTT TTA 
Glu He Asp Ser Leu lie Ser Ser Asp Phe Leu 

TAT GGC GAT GAA ATC AAA CC 
Tyr Gly Asp Glu He Lys 



CTG TTT TTA GTT TTA ATC GCT TTA GTC TTT AAC 
Leu Phe Leu Val Leu He Ala Leu Val Phe Asn 

GCT TTA GAA GTC ATT AAA CAA AGA GGG GTT TTA 
Ala Leu Glu Val He Lys Gin Arg Gly Val Leu 

GGA TCT GTG GAT TCT AAA GGG AAA TAT CAA GGC 
Gly Ser Val Asp Ser Lys Gly Lys Tyr Gin Gly 

GAT TTA TTG GGC GAT GAA AAT AAG ATT GAG TTT 
Asp Leu Leu Gly Asp Glu Asn Lys He Glu Phe 

TTA AAA GCC AAT AAA GTG GAT ATT ATC ATG GCT 
Leu Lys Ala Asn Lys Val Asp He He Met Ala 

GTG GAT TTC GCT AAT CCG TAT ATG AAA GTC GCT 
Val Asp Phe Ala Asn Pro Tyr Met Lys Val Ala 

AAT ATA GAA GAG TTG AAG GAT AAA GAG TTG ATT 
Asn He Glu Glu Leu Lys Asp Lys Glu Leu He 

ACT AAA AAT TAC CCC AAT ATC AAA CTT TTG AAA 
Thr Lys Asn Tyr Pro Asn He Lys Leu Leu Lys 

TTA AAT AAT AAG GCC ACC GCT CTA GCC CAT GAC 
Leu Asn Asn Lys Ala Thr Ala Leu Ala His Asp 

CCT GAA TTT AAA TTA GGC ATT ACA AGC CTT GGC 
Pro Glu Phe Lys Leu Gly He Thr Ser Leu Gly 

GGC AAC CCT AAG CTT TTA GAA TGG TTG AAT AAC 
Gly Asn Pro Lys Leu Leu Glu Trp Leu Asn Asn 

AAA GAA GCT TAT CAA GAA ACT TTA GAG CCT GTT 
Lys Glu Ala Tyr Gin Glu Thr Leu Glu Pro Val 
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ATG AAA AAC ACC AAT ACA AAA 
Met Lys Asn Thr Asn Thr Lys 

GCA CTC AAA AAA GGG CTT TTA 
Ala Leu Lys Lys Gly Leu Leu 

GAA GAC GAT GGC TTT TAT ATG 
Glu Asp Asp Gly Phe Tyr Met 

AAA GGC AGC ACC CTA AGG AAT 
Lys Gly Ser Thr Leu Arg Asn 

GGT AAT GGG CTT TTA GCC TTA 
Gly Asn Gly Leu Leu Ala Leu 

ATT TTC AAT ACT AAT ACA ACT 
lie Phe Asn Thr Asn Thr Thr 

CCC CAA ATT GAG CAA CGC TTT 
Pro Gin lie Glu Gin Arg Phe 

TTG AGT AAT GTG CTT TAT AAC 
Leu Ser Asn Val Leu Tyr Asn 

GAA TAT GTA GGG ATT ATA AAA 
Glu Tyr Val Gly lie He Lys 

AGT GTG GCG CTT CTA AAC GCG 
Ser Val Ala Leu Leu Asn Ala 

CWA TTA GCC CAA ATG GAG CTT 
? Leu Ala Gin Met Gin Leu 

TTG AAT AAG AGC GGT GGT GCA 
Leu Asn Lys Ser Gly Gly Ala 

GCT ACT TAC CAA GAG AAT CTA 
Ala Thr Tyr Gin Glu Asn Leu 

CCC CAA TTT GGG CMA GGC ACA 
Pro Gin Phe Gly ? Gly Thr 

TAT AAG CAA TTT TTT GGG AAC 
Tyr Lys Gin Phe Phe Gly Asn 

TTT ACG CAA TTG GGC AGT CTT 
Phe Thr Gin Leu Gly Ser Leu 

GAC TTT TTA TGG AAT ATC TTT 
Asp Phe Leu Trp Asn He Phe 

GGC ATT CAA ATA GCG GGT AAC 
Gly He Gin He Ala Gly Asn 

GAA TAC CCC ACT CCC ACA AAT 
Glu Tyr Pro Thr Pro Thr Asn 

ACC ATG CAC CGC CG 
Thr Met His Arg 
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GAG ATA AAG AAT ACA AGA ATG 
Glu He Lys Asn Thr Arg Met 

AAA ACC GCT TTG CTT TTT AGC 
Lys Thr Ala Leu Leu Phe Ser 

GGA GTG GGC TAT CAA ATC GGC 
Gly Val Gly Tyr Gin lie Gly 

AAT GTC ATT GAT GAT TTC CGC 
Asn Val He Asp Asp Phe Arg 

GCG ACA AAC ACG ACC ATG GAC 
Ala Thr Asn Thr Thr Met Asp 

GTT GGC AAC AAC AAC GCA GAA 
Val Gly Asn Asn Asn Ala Glu 

GAA GCG AAT AAA AAC GCT TAT 
Glu Ala Asn Lys Asn Ala Tyr 

TTG GTT AAT AAT AGT AAT AAT 
Leu Val Asn Asn Ser Asn Asn 

GTT CTC TAT GGT TCT CAA AAT 
Val Leu Tyr Gly Ser Gin Asn 

CTT ACA AGG GTG AAT CTG GAT 
Leu Thr Arg Val Asn Leu Asp 

TTT AAT GAC ACT TCT GCA GCA 
Phe Asn Asp Thr Ser Ala Ala 

GGG GCC ATG CTT CAA AAG GAT 
Gly Ala Met Leu Gin Lys Asp 

AAA CAG CTA GGA GGG ATG CTA 
Lys Gin Leu Gly Gly Met Leu 

AGC TCT CAG CAT GGG GTT ATT 
Ser Ser Gin His Gly Val He 

AAG AGG AAT ATA GGC TTA CGG 
Lys Arg Asn He Gly Leu Arg 

AGC AGC GCT GTT AAA GCG AAC 
Ser Ser Ala Val Lys Ala Asn 

AGA AGG GTT TTT AGC GAT CAG 
Arg Arg Val Phe Ser Asp Gin 

ACT TGG GAT AGC TCT TTA AGA 
Thr Trp Asp Ser Ser Leu Arg 

TTC CAA TTT TTA TTT AAT TTG 
Phe Gin Phe Leu Phe Asn Leu 



GAA AAA GGT TAT AGT CAA TAC CAC 
Glu Lys Gly Tyr Ser Gin Tyr His 

CTT CCT TTA AGC ATG GCG TTA GCT 
Leu Pro Leu Ser Met Ala Leu Ala 

GGT GCG CAA CAA AAT ATC AAT AAC 
Gly Ala Gin Gin Asn He Asn Asn 

CAA GTG GGC GTG GGT ATG GCA GGG 
Gin Val Gly Val Gly Met Ala Gly 

GCT CTT TTA GGG ATA GGC AAT CAA 
Ala Leu Leu Gly He Gly Asn Gin 

TTA ACC CAG TTT AAA AAA ATA CTC 
Leu Thr Gin Phe Lys Lys He Leu 

AGC GTT CAA GCC TTG CAA GTG TAT 
Ser Val Gin Ala Leu Gin Val Tyr 

GGC AGC AAT AAT GGA GTC GTT CCT 
Gly Ser Asn Asn Gly Val Val Pro 

GAA TTC AGT CTC TTA GCC ACG GAG 
Glu Phe Ser Leu Leu Ala Thr Glu 

AGC AAT TCG GTG TTT TTA AAA GGG 
Ser Asn Ser Val Phe Leu Lys Gly 

AAG CTA GGC CAG ATC GCA GAA AGC 
Lys Leu Gly Gin He Ala Glu Ser 

GTG AAA ACC ATC TCG GAT CGA ATC 
Val Lys Thr He Ser Asp Arg He 

AAG AAT TAC GAT GAG CCA TAC CTA 
Lys Asn Tyr Asp Glu Pro Tyr Leu 

AAT GGC TTT GGC ATT CAA ATG GGC 
Asn Gly Phe Gly He Gin Met Gly 

TAT TAC GCT TTC TTT GAT TAC GGC 
Tyr Tyr Ala Phe Phe Asp Tyr Gly 

ATC TTT ACT TAT GGT GCT GGC ACG 
He Phe Thr Tyr Gly Ala Gly Thr 

TCC TTG AAT GTG GGG GTG TTT GGA 
Ser Leu Asn Val Gly val Phe Gly 

GGT CAA ATT GAG AAT TCG TTT AAA 
Gly Gin He Glu Asn Ser Phe Lys 

GGC TTA AGG GCT CAT TTT GCC AGC 
Gly Leu Arg Ala His Phe Ala Ser 
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TTT 

Phe 


ACA 
Thr 


AAG 
Lys 


ATT 

He 


ATG 
Met 


AAG 
Lvs 


AGA 
Ara 


GTT 
Val 


AGA 
m y 


GGG 
Glv 


CTT 
Leu 


GTG 
Val 


AAA 


AAA 


CAC 
His 


CCC 
Pro 


AAG 
Lys 


AAA 
Lys 


AGC 
Ser 


AAG 
Lys 


GCG 
Aia 


GCA 
Ala 


TTA 
Leu 


GTA 
val 


GTA 
Val 


TTG 
Leu 


ACC 
Thr 


CAT 
His 


GTT 
Val 


GCG 
Ala 


TGC 

Cys 


AAG 
Lys 


AAA 
Lys 


GCG 
Ala 


AAA 
Lys 


GAA 
Glu 


TTG GAC 
Leu Asp 


GAT 
Asp 


AAA 
Lys 


GTC 
Val 


CAG 
Gin 


GAT 
Asp 


AAA 
Lys 


TCC 
Ser 


AAA 
Lys 


CAA 
Gin 


GCT 
Ala 


GAA 
Glu 


AAA 
Lys 


GAA 
Glu 


AAT 
Asn 


CAA 
Gin 


ATC 
He 


AAT 
Asn 


TGG 
Trp 


TGG 
Trp 


AAA 
Lys 


TAT 
Tyr 


TCA 
Ser 


GGA TTA ACA 
Gly Leu Thr 


ATA 
He 


GCG 
Ala 


ACA 
Thr 


AGT 
Ser 


TTA 
Leu 


TTA 
Leu 


TTA 
Leu 


GCC 
Ala 


GCT 
Ala 


TGT 
Cys 


AGT 
Ser 


GCT 
Ala 


GGT 
Gly 


GAT 
Asp 


ATT 
He 


GAT 
Asp 


AAA 

Lys 


CAA 
Gin 


ATA 
He 


GAG 
Glu 


TTA 
Leu 


GAA 
Glu 


CAA 
Gin 


GAA 
Glu 


AAA 
Lys 


CAA 
Gin 


AAG 
Lys 


ACA 
Thr 


GAA 
Glu 


CAA 
Gin 


GAA 
Glu 


CAA 
Gin 


CAG 
Gin 


AAA 
Lys 


ACA 
Thr 


GAA 
Glu 


CAA 
Gin 


GAA 
Glu 


AGA 
Arg 


CAA 
Gin 


AAA 
Lys 















HPC117 

ATG CCA TAC GCC TTA AGA AAA AGA TTT TTC AAA CGC CTT GCG CTG ATT GTT TCC ACT TTT TGC GCG 
Met Pro Tyr Ala Leu Arg Lys Arg Phe Phe Lys Arg Leu Ala Leu He Val Ser Thr Phe Cys Ala 

ATA AGC TTG AAC GCT AAA AGC TAT CTG TTT TCC CCC TTG CCC CCA GCG CAC CAA CAA ATC ATT AAG 
He Ser Leu Asn Ala Lys Ser Tyr Leu Phe Ser Pro Leu Pro Pro Ala His Gin Gin He He Lys 

ACA GAG CCT TGC TCT TTG GAA TGC TTG AAA GAC TTG ATG TTG CAA AAT CAA ATC TTT TCT TTT GTT 
Thr Glu Pro Cys Ser Leu Glu Cys Leu Lys Asp Leu Met Leu Gin Asn Gin He Phe Ser Phe Val 

TCT CAA TAC GAT AAC AAC AAC CAA GAT GAG AGC CTT AAA ACT TAT TAT CAT GAC ATA CTC AAT AAA 
Ser Gin Tyr Asp Asn Asn Asn Gin Asp Glu Ser Leu Lys Thr Tyr Tyr His Asp He Leu Asn Lys 

CTC AAC CCT GCA TTC ATC GCT TCT CAA ACT CCA GCT AAA GAC AGC TAT GAG CCT AAG ATT GAA TTA 
Leu Asn Pro Ala Phe He Ala Ser Gin Thr Pro Ala Lys Asp Ser Tyr Glu Pro Lys He Glu Leu 

GCG GTT TTA CTG CCT AAA AAG GTG GTG GGG CGT TAT GCC ATT TCG GTG ATG AAC ACC CTT TTA GCG 
Ala Val Leu Leu Pro Lys Lys Val Val Gly Arg Tyr Ala He Ser Val Met Asn Thr Leu Leu Ala 

TAT TTG AAC ACC AGA AAC AAC GAT TTC AAT ATC CAA GTC TTT GAC AGC GAT GAA GAG AGT CCT GAA 
Tyr Leu Asn Thr Arg Asn Asn Asp Phe Asn He Gin Val Phe Asp Ser Asp Glu Glu Ser Pro. Glu 

AAA TTA GAG CAA ACC TAT AAA GAA ATT GAA AAA GAA AAA TTC CCT TTT GTG ATA GCC TTA TTA ACC 
Lys Leu Glu Gin Thr Tyr Lys Glu He Glu Lys Glu Lys Phe Pro Phe Val He Ala Leu Leu- Thr 

AAA GAG GGC GTG GAA AAT TTG CTC CAA AAC ACC ACG ATT AGC ACC CCT ACT TAT GTG CCT ACG GTG 
Lys Glu Gly Val Glu Asn Leu Leu Gin Asn Thr Thr He Ser Thr Pro Thr Tyr Val Pro Thr val 

AAT AGA ACG CAA TTA GAA AAT CAA ACT GAG CGT TCT TTA AGC GAG CGC TTG TAT TTT GGG GGG ATT 
Asn Arg Thr Gin Leu Glu Asn Gin Thr Glu Arg Ser Leu Ser Glu Arg Leu Tyr Phe Gly Gly He 

GAC TAT AAA GAG CAA TTA AGC ATG CTC ACG GCT TTC ATT AGC CCT AAT TCG CCC GTG ATT GAA TAC 
Asp Tyr Lys Glu Gin Leu Ser Met Leu Thr Ala Phe He Ser Pro Asn Ser Pro Val He Glu Tyr 

GAT GAT GAT GGC CTA ATA GGA GAA CGC TTG AGG CAA ATC ACG GAG TCT TTA AGC ATT GAA GTC AAA 
Asp Asp Asp Gly Leu He Gly Glu Arg Leu Arg Gin He Thr Glu Ser Leu Ser He Glu Val Lys 

CAC CAA GAA AAT ATT TCT TAC AAA CAA GCC ACC AGT TTT TCT AAA AAT TTT AGA AAA AAC GAT GCG 
His Gin Glu Asn He Ser Tyr Lys Gin Ala Thr Ser Phe Ser Lys Asn Phe Arg Lys Asn Asp Ala 

TTT TTT AAA AAT TCT ATT TTG ATT TTA AAC ACC CCT ACC ACT AAA AGC GGC CTT ATC CTT TCT CAA 
Phe Phe Lys Asn Ser He Leu He Leu Asn Thr Pro Thr Thr Lys Ser Gly Leu He Leu Ser Gin 

ATA GGG CTT TTA GAA TAC AAG CCC TTT AAA ATC CTT TCC ACA CAA ATC AAT TTC AAC CTC TCT TTA 
He Gly Leu Leu Glu Tyr Lys Pro Phe Lys He Leu Ser Thr Gin He Asn Phe Asn Leu Ser Leu 

* CTC TTA CTC ACC CAG CCT AAA GAC AGA AAG AAT TTA TTC ATC GTC AAT GCC TTG CAA AAT AGC GAT 
Leu Leu Leu Thr Gin Pro Lys Asp Arg Lys Asn Leu Phe He Val Asn Ala Leu Gin Asn Ser Asp 

GAA ACG CTT ATA GAA TAC GCC TCC TTA TTG GAG AGC GAT TTA AGG CAT GAT TGG GTG AAT TAT TCC 
Glu Thr Leu He Glu Tyr Ala Ser Leu Leu Glu Ser Asp Leu Arg His Asp Trp Val Asn Tyr Ser 

AGT GCA ATT GGG CTA GAG GTG TTT TTA AAC ACA CTA GAT CCG CAT TTT AAA AAA TCT TTT CAA GAA 
Ser Ala He Gly Leu Glu Val Phe Leu Asn Thr Leu Asp Pro His Phe Lys Lys Ser Phe Gin Glu 

AGT TTA GAA GAC AAT CAA GTC CGT TAC CAC AAT CAA ATT TAT CAG GCT TTA GGG TAT TCT TTT GAG 
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Ser Leu Glu Asp Asn Gin Val Arg Tyr His Asn Gin He Tyr Gin Ala Leu Gly Tyr Ser Phe Glu 

CCG ATA AAA AAT GAA AGC GGA ACA AAA AAA GAA TAA 
Pro He Lys Asn Glu Ser Gly Thr Lys Lys Glu 

HPC129 

ATG TCA AAT AGC ATG TTG GAT AAA AAT AAA GCG ATT CTT ACA GGG GGT GGG GCT TTA TTA TTA GGG 
Met Ser Asn Ser Met Leu Asp Lys Asn Lys Ala He Leu Thr Gly Gly Gly Ala Leu Leu Leu Gly 

CTA ATC GTG CTT TTT TAT TTA GCT TAT CGC CCT AAG GCT GAA GTG CTG CAA GGG TTT TTG GAA GCC 
Leu He Val Leu Phe Tyr Leu Ala Tyr Arg Pro Lys Ala Glu Val Leu Gin Gly Phe Leu Glu Ala 

AGA GAA TAC AGC GTG AGT TCC AAA GTC CCT GGC CGC ATT GAA AAG GTG TTT GTT AAA AAA GGC GAT 
Arg Glu Tyr Ser Val Ser Ser Lys Val Pro Gly Arg He Glu Lys Val Phe Val Lys Lys Gly Asp 

CGC ATT AAA AAG GGC GAT TTG GTT TTT AGC ATT TCT AGC CCT GAA TTA GAA GCC AAA CTC GCT CAA 
Arg He Lys Lys Gly Asp Leu Val Phe Ser He Ser Ser Pro Glu Leu Glu Ala Lys Leu Ala Gin 

GCT GAA GCC GGG CAT AAA GCC GCT AAA GCG CTT AGC GAT GAA GTC AAA AGA GGC TCA AGA GAC GAA 
Ala Glu Ala Gly His Lys Ala Ala Lys Ala Leu Ser Asp Glu Val Lys Arg Gly Ser Arg Asp Glu 

ACG ATC AAT TCT GCA AGA GAT GTT TGG CAA GCG GCA AAA TCC CAA GCG ACT CTA GCC AAA GAG ACT 
Thr He Asn Ser Ala Arg Asp Val Trp Gin Ala Ala Lys Ser Gin Ala Thr Leu Ala Lys Glu Thr 

TAT AAG CGC GTT CAA GAT TTG TAT GAT AAC GGC GTG GCG AGC TTG CAA AAG CGC GAT AAA GCC TAT 
Tyr Lys Arg Val Gin Asp Leu Tyr Asp Asn Gly Val Ala Ser Leu Gin Lys Arg Asp Lys Ala Tyr 

GCA GCT TAT 
Ala Ala Tyr 



HPC132 

ATG AAA ATT TTA AGT TTA TGG 

Met Lys He Leu Ser Leu Trp 

GGC GAA GAG CCT AAA TAT AAG 

Gly Glu Glu Pro Lys Tyr Lys 

GGC GGT GTT TTG AGG AAT GAC 

Gly Gly Val Leu Arg Asn Asp 



TTA GGG GTG TTT TGT TTC CTT 
Leu Gly Val Phe Cys Phe Leu 

GAG AAT TTC ACG CAT TTT GAA 
Glu Asn Phe Thr His Phe Glu 

GCC ATA GGG ACT TTT GAT AGC 
Ala He Gly Thr Phe Asp Ser 



AAG GCT ACG CCT TAT TTA TAC TTG 
Lys Ala Thr Pro Tyr Leu Tyr Leu 

TAC GCT AAC CCT AAC GCT AGA AAG 
Tyr Ala Asn Pro Asn Ala Arg Lys 

CTT AAC CCT TGA 
Leu Asn Pro 
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HPC137 

ATG AAA ACT TAT TTA TAT AAC CAT TTT TTA TTT TTC TGC TTT ATT CTG GGA GCG TTT TTA TTA GGT 
Met Lys Thr Tyr Leu Tyr Asn His Phe Leu Phe Phe Cys Phe lie Leu Gly Ala Phe Leu Leu Gly 

TTG CTT AGT CCA GCT TAT GCT TTG AGT GTT ATC ACC ACT AAA GAA ATT AAC GCT AAT TTG CCT AAT 
Leu Leu Ser Pro Ala Tyr Ala Leu Ser Val lie Thr Thr Lys Glu He Asn Ala Asn Leu Pro Asn 

GGA GCG ATA GAA AGC AGG GTG GTG TTA GGC AAG AGG GTG TTT AAA GTA GAA GCT CAT GGG TTT TAT 
Gly Ala He Glu Ser Arg Val Val Leu Gly Lys Arg Val Phe Lys Val Glu Ala His Gly Phe Tyr 

TTT AGA AAC AAC GGA ACT AAC AGC ATA GAC ATA GAA ATC ACC AGT CTT TTA AGA GAC AAT CAA TCG 
Phe Arg Asn Asn Ala Thr Asn Ser He Asp lie Glu He Thr Ser Leu Leu Arg Asp Asn Gin Ser 

TTT CCT TTG ACT AGC CCT GCT AAA ACC AGT TTA AAA ATA CCT TCT AAC GCC AAG ATT AAA AAA TCC 
Phe Pro Leu Thr Ser Pro Ala Lys Thr Ser Leu Lys He Pro Ser Asn Ala Lys He Lys Lys Ser 

ACT CTC CTT GTT TTA AAG GGC GAG AAT GCT GAA GAA GTG GCT AAG ATT TTA GGC ATT AGC AAA GAA 
Thr Leu Leu Val Leu Lys Gly Glu Asn Ala Glu Glu Val Ala Lys He Leu Gly He Ser Lys Glu 

GAA TAC CAA AAG CTA GAA AAC ACC GCT CAA ACC AAC GCT ACC AAT GAC CCT ATG TAT GCC AAC ACG 
Glu Tyr Gin Lys Leu Glu Asn Thr Ala Gin Thr Asn Ala Thr Asn Asp Pro Met Tyr Ala Asn Thr 

CCT TTT AGT AAT GGC TCT GAT AGT TCC GCT TAC GAT AAC AAT CCT AAT AGC CCT AAC AAT AAC GCT 
Pro Phe Ser Asn Gly Ser Asp Ser Ser Ala Tyr Asp Asn Asn Pro Asn Ser Pro Asn Asn Asn Ala 

ATC AAT GGT AAA GAT GGC GCA AAT GGG AGT AAT GGC TAT GGG GTA AAT GGC AAC GAT GGG ATA AAT 
He Asn Gly Lys Asp Gly Ala Asn Gly Ser Asn Gly Tyr Gly Val Asn Gly Asn Asp Gly He Asn 

GGG AGC AGT GGG AGT AAT GGA AAT AAT TCA AAT AAT AAT GCC GTG GGC AGT GGT ATT GAT ACA GAT 
Gly Ser Ser Gly Ser Asn Gly Asn Asn Ser Asn Asn Asn Ala Val Gly Ser Gly He Asp Thr Asp 

GGC GTG TTG GGT GTG GAT GGA GTG AAT GGA TCT AAC TCT TCA AGC GGT GGC TCT GTA GGG GGT TAT 
Gly Val Leu Gly Val Asp Gly Val Asn Gly Ser Asn Ser Ser Ser Gly Gly Ser Val Gly Gly Tyr 

GAG AAT AAT TTC ACT AAT CAT GGC TCT ACT AGC AAT AAC ACA GGA GGG TAT GAC AAT TTT AAT AAT 
Glu Asn Asn Phe Thr Asn His Gly Ser Thr Ser Asn Asn Thr Gly Gly Tyr Asp Asn Phe Asn Asn 

AAT AGC TCA AGT GGT GGG GGG TTA GGG AAT GGG GGG CTT TTC CCT ATT CCT TTT GGT AAT GGT GGC 
Asn Ser Ser Ser Gly Gly Gly Leu Gly Asn Gly Gly Leu Phe Pro He Pro Phe Gly Asn Gly Gly 

ACA AAC AAT TCC AAT AAT CCT ACT AAC ACC ACT AGC CCA ACT AAT GGC AGT AGT TCC AAT AGC GCC 
Thr Asn Asn Ser Asn Asn Pro Thr Asn Thr Thr Ser Pro Thr Asn Gly Ser Ser Ser Asn Ser Ala 

ACT AAT CCT AAC TCG CAA GAA AAC AAT TAC TCC AGC CAG TAT TGT AAA GCG CCC AAR TTA AGC CCT 
Thr Asn Pro Asn Ser Gin Glu Asn Asn Tyr Ser Ser Gin Tyr Cys Lys Ala Pro ? Leu Ser Pro 

AAC AAC ACG ATG AAA CTA GAT GTT ATC GCT AAA GAT GGC TCT TGT ATT TCT ATG AAC GCT TTA AGA 
Asn Asn Thr Met Lys Leu Asp Val He Ala Lys Asp Gly Ser Cys He Ser Met Asn Ala Leu Arg 

GAT GAC ACT AAA TGT GCT TAT AGA TAC GAT TTT GAA GCC G 
Asp Asp Thr Lys Cys Ala Tyr Arg Tyr Asp Phe Glu Ala 
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HPC14 9 

TTG TCT AAA GGT TTG AGT ATC GGT AAT AAA ATC ATA TTG TGG GTG GCG TTG ATT GTG ATC GTG TGC 
Met Ser Lys Gly Leu Ser He Gly Asn Lys He He Leu Trp Val Ala Leu He Val He Val Cys 

GTG AGC ATT TTA GGG GTG TCC TTG AAC AGC AGG GTG AAA GAG ATT TTA AAA GAA AGC GCT CTG CAT 
Val Ser He Leu Gly Val Ser Leu Asn Ser Arg Val Lys Glu He Leu Lys Glu Ser Ala Leu His 

TCT ATG CAA GAT AGT TTG CAT TTC AAG GTT AAG GAA GTG CAA GGG GTT CTT GAA AAC ACT TAT ACG 
Ser Met Gin Asp Ser Leu His Phe Lys Val Lys Glu Val Gin Gly Val Leu Glu Asn Thr Tyr Thr 

AGC ATG GGC ATT GTC AAA GAA ATG CTC CCT AAA GAC ACC AAA AGA GAA ATC AAA ATC CGC TTG TTG 
Ser Met Gly He Val Lys Glu Met Leu Pro Lys Asp Thr Lys Arg Glu He Lys He Arg Leu Leu 

AAA AAC TTC ATT TTA GCC AAT TCG CAT GTC GCT GGG GCG AGC GTG TTT TTT AAA GAC AGA GAA GAT 
Lys Asn Phe He Leu Ala Asn Ser His Val Ala Gly Ala Ser Val Phe Phe Lys Asp Arg Glu Asp 

TTA GGA TTA ACG CTT TTA AGG GAT AAC GAT ACG ATT AAA GTG ATG GAA AAC CCG TCA TTA GGG AAT 
Leu Gly Leu Thr Leu Leu Arg Asp Asn Asp Thr He Lys Val Met Glu Asn Pro Ser Leu Gly Asn 

AAC CCT TTA GCG CAA AAA GCG ATG AAA AAT AAA GAA ATT TCT AAA AGC TTG CCT TAT TAT AGG AAA 
Asn Pro Leu Ala Gin Lys Ala Met Lys Asn Lys Glu He Ser Lys Ser Leu Pro Tyr Tyr Arg Lys 

ATG CCT AAT GGG GCG GAA GTT TAT GGG GTT GAT ATT CTT TTA CCT TTA TTG AAT GAG AAC GCT CAA 
Met Pro Asn Gly Ala Glu Val Tyr Gly Val Asp He Leu Leu Pro Leu Leu Asn Glu Asn Ala Gin 

GAG GTT GTA GGG GCT TTG ATG GTT TTT CTT TCC ATT GAC AGC TTC AGC AAT GAA ATC ACT AAA AAC 
Glu Val Val Gly Ala Leu Met Val Phe Leu Ser He Asp Ser Phe Ser Asn Glu He Thr Lys Asn 

AGG AGC GAT TTG TTT TTA ATT GGT GTT AAG GGT AAA GTG CTT TTG AGC GCG AAT AAG AGT TTG CAA 
Arg Ser Asp Leu Phe Leu lie Gly Val Lys Gly Lys Val Leu Leu Ser Ala Asn Lys Ser Leu Gin 

GAC AAA TCT ATC GCA GAA ATT TAT AAG AGC GTG CCT AAA GCC ACC AAC GAA GTG CTG GCT ATT TTA 
Asp Lys Ser He Ala Glu He Tyr Lys Ser Val Pro Lys Ala Thr Asn Glu Val Leu Ala He Leu 

GAA AAC GGC TCT AAA GCG ACT TTA GAA TAT TTG GAT CCC TTT AGC CAT AAG GAA AAT TTC TTA GCC 
Glu Asn Gly Ser Lys Ala Thr Leu Glu Tyr Leu Asp Pro Phe Ser His Lys Glu Asn Phe Leu. Ala 

GTT GAA CCC TTT AAA ATG CTA GGC AAA ACA GAA AGT AAA GAC AWT CTT AAT TGG ATG ATC GCT TTA 
Val Glu Pro Phe Lys Met Leu Gly Lys Thr Glu Ser Lys Asp ? Leu Asn Trp Met He Ala Leu 

ATC ATT GAA AAA GAC AAG GTC TAT GAG CAA GTG GGC TCG GTG CGT TTT GTG GTG ATC ATA GCG AGC 
He He Glu Lys Asp Lys Val Tyr Glu Gin Val Gly Ser Val Arg Phe Val Val He He Ala Ser 

GCG ATC ATG GTG TTA GCC TTG ATT ATA GCG ATC ACT CTT TTA ATG CGA GCG ATT GTG AGC AAT CGT 
Ala He Met Val Leu Ala Leu He He Ala He Thr Leu Leu Met Arg Ala He Val Ser Asn Arg 

TTG GAA GCC GTT TCT AGC ACC TTG TCT CAT TTC TTT AAA TTA TTG AAC AAT CAA GCC CAT TCT AGC 
Leu Glu Ala Val Ser Ser Thr Leu Ser His Phe Phe Lys Leu Leu Asn Asn Gin Ala His Ser Ser 

GAT ATT AAA TTG ATT GAA GCA AAA TCC AAT GAC GAA TTA GGG CGC ATG CAA ACA GCG ATC AAT AAA 
Asp He Lys Leu He Glu Ala Lys Ser Asn Asp Glu Leu Gly Arg Met Gin Thr Ala He Asn Lys 

AAT ATC TTG CAA ACC CAA AAA ACC ATG CAA GAA GAC AGG CAA GCC GTC CAA GAC ACC ATT AAA GTG 
Asn He Leu Gin Thr Gin Lys Thr Met Gin Glu Asp Arg Gin Ala Val Gin Asp Thr He Lys Val 

GTT TCA GAC GTG AAA GCA GGG AAT TTT GCG GTG CGC ATC ACA GCT GAT CCC GCA AGC CCT GAT TTG 
Val Ser Asp Val Lys Ala Gly Asn Phe Ala Val Arg He Thr Ala Asp Pro Ala Ser Pro Asp Leu 

AAA GAA TTG AGG GAC GCG CTA AAT GGG ATC ATG GAT TAT TTG CAA GAA AGC GTA GGG ACT CAC ATG 
Lys Glu Leu Arg Asp Ala Leu Asn Gly He Met Asp Tyr Leu Gin Glu Ser Val Gly Thr His Met 

CCA AGC ATT TTC AAA ATC TTT GAA AGC TAT TCT GGT TTG GAT TTT AGA GGC CGA ATC CAA AAC GCT 
Pro Ser He Phe Lys He Phe Glu Ser Tyr Ser Gly Leu Asp Phe Arg Gly Arg He Gin Asn Ala 

TCG GGT AGG GTG GAA TTG GTT ACT AAC GCT TTA GGG CAA GAA ATC CAA AAA ATG CTA GAA ACT TCG 
Ser Gly Arg Val Glu Leu Val Thr Asn Ala Leu Gly Gin Glu He Gin Lys Met Leu Glu Thr Ser 

TCT AAT TTT GCC AAA GAT TTA GCG AAC GAT AGC GCG AAT TTA AAA GAA TGC GTG CAA AAT TTA GAA 
Ser Asn Phe Ala Lys Asp Leu Ala Asn Asp Ser Ala Asn Leu Lys Glu Cys Val Gin Asn Leu Glu 

AAG GCT TCA AAC TCC CAA CAC AAA AGC TTG ATG GAA ACT TCT AAA ACG ATA GAG AAT ATC ACC ACT 
Lys Ala Ser Asn Ser Gin His Lys Ser Leu Met Glu Thr Ser Lys Thr He Glu Asn He Thr Thr 



ERSATZBLATT (REGEL 26) 



WO 00/73502 



PCT/EP00/05024 



Abbildung 15 



78 / 82 



TCC ATT CAA GGC GTG AGC TCT CAA AGT GAA GCC ATG ATT GAA CAA GGG CAA GAC ATT AAA AGC ATT 
Ser lie Gin Gly Val Ser Ser Gin Ser Glu Ala Met lie Glu Gin Gly Gin Asp He Lya Ser lie 

GTA GAA ATC ATT AGA GAC ATC GCT GAT CAA ACC AAT CTA TTA GCC CTA AAC GCC GCT ATT GAA GCC 
Val Glu He He £.rg Asp He Ala Asp Gin Thr Asn Leu Leu Ala Leu Asn Ala Ala He Glu Ala 



HPC161 

GTG GCG GTG AAA AAA ATC GTT GTG GGT TGG TGT GTG GCG TTG GCT TTT TTA AGC GCA AAT CCA GCG 
Met Ala Val Lys Lys He Val Val Gly Trp Cys Val Ala Leu Ala Phe Leu Ser Ala Asn Pro Ala 

CAA GCC GAT AAA GCG ATC AGT AAT GCG GAT TTG ATT AAA GAA ATA AGG GAC TTA AAA AAA ATC ATC 
Gin Ala Asp Lys Ala He Ser Asn Ala Asp Leu He Lys Glu He Arg Asp Leu Lys Lys He He 

AGC GCG CAA AAC ACT GAG ATC AAC AAT TTA AGA AGA GTG CAA GAA GTC TTG TCT GGG CAA TTA GGG 
Ser Ala Gin Asn Thr Glu lie Asn Asn Leu Arg Arg Val Gin Glu Val Leu Ser Gly Gin Leu Gly 

GAT ATG CGT AAG GAT ATA TTA AGC ACT AGA GAT TAT TGC ATT AGC TTA AGG CCT TAT ATC TAT AAT 
Asp Met Arg Lys Asp He Leu Ser Thr Arg Asp Tyr Cys He Ser Leu Arg Pro Tyr He Tyr Asn 



HPC169 

ATG GTA TTT GAC AGA ACA ATC AGC GTA AGA GAA AAA AAA GCG GCT AAA ACG CTT GGG ATT GTG GGG 
Met Val Phe Asp Arg Thr He Ser Val Arg Glu Lys Lys Ala Ala Lys Thr Leu Gly He Val Gly 

ATC GTC TTT TTT ATT TTG TTT GGC ATC GTA ATA AGC GGG GTG GCT TTT CAA AAA GAG TGG GTG CAA 
He Val Phe Phe He Leu Phe Gly He Val He Ser Gly Val Ala Phe Gin Lys Glu Trp Val Gin 

CAA TTG GAT TTA TTT TTT ATA GAC TTG ATC CAC AAC CCT GCC CCC ATT CAA 
Gin Leu Asp Leu Phe Phe He Asp Leu He His Asn Pro Ala Pro He Gin 

HPC172 

CGA TAT GAT AAA GGG TTT GAA AAA GAT AAA AAA GAT CTA GAA TAT TAT TCT AAA GCT TGC GAG TTA 
Arg Tyr Asp Lys Gly Phe Glu Lys Asp Lys Lys Asp Leu Glu Tyr Tyr Ser Lys Ala Cys Glu. Leu 

AAC TAT GGC GAT GGC TGT GCG ATT TTA GGG GAT ATT TAT CGT AAT GGT GAA GGC GTA ACA CAA AAT 
Asn Tyr Gly Asp Gly Cys Ala He Leu Gly Asp He Tyr Arg Asn Gly Glu Gly Val Thr Gin Asn 

TTT AAA AAA GCT TTC AAA TAT TAC TCT AAA GCT TGC GAA TTA AAT AAT GGT GAA GGG TGT TCC AAA 
Phe Lys Lys Ala Phe Lys Tyr Tyr Ser Lys Ala Cys Glu Leu Asn Asn Gly Glu Gly Cys Ser Lys 

TTA GGA GGG GAT TAT TTT TTT GGT GAA AGC GTA ACG CAA GAT CTT AAA AAA GCT TTT GGA TAT TAC 
Leu Gly Gly Asp Tyr Phe Phe Gly Glu Ser Val Thr Gin Asp Leu Lys Lys Ala Phe Gly Tyr Tyr 

TCT AAA GCT TGC GAA TTA AAC GAA GCT CTA ACA TGC ACG CTT GTA GGA GAG TTT TAT CGT GAT GGT 
Ser Lys Ala Cys Glu Leu Asn Glu Ala Leu Thr Cys Thr Leu Val Gly Glu Phe Tyr Arg Asp Gly 

GAA GGC GTA ACA AAG GAT CTT AAA AAA GCT TTT GAA TAT TCT GCT AAA GCT TGT GAA TTG AAC GAT 
Glu Gly Val Thr Lys Asp Leu Lys Lys Ala Phe Glu Tyr Ser Ala Lys Ala Cys Glu Leu Asn Asp 

GCT AAA GGG TGT TAC GCT CTA GCA GCG TTT TAT AAT GAG GGT AAG GGC GTA GCA AAG GAT GAA AAA 
Ala Lys Gly Cys Tyr Ala Leu Ala Ala Phe Tyr Asn Glu Gly Lys Gly Val Ala Lys Asp Glu Lys 

CAA ACG ACA GAA AAC CTT GAA AAG AGT TGC AAG CTA GGA TTA AAA GAA GCA TGC GAT ATT CTC AAA 
Gin Thr Thr Glu Asn Leu Glu Lys Ser Cys Lys Leu Gly Leu Lys Glu Ala Cys Asp He Leu Lys 

GAA CAA AAA CAA TAA 
Glu Gin Lys Gin 



GCA 
Ala 



AGG 
Arg 



TGG CGC TAG 
Trp Arg 
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HPC174 

ATG AAA AAA TTT TTT TCT CAA TCT TTA TTA GCT 
Met Lys Lys phe Phe Ser Gin Ser Leu Leu Ala 

GAT GGC AAT GGC GTT TTT TTA GGG GCG GGT TAT 
Asp Gly Asn Gly Val Phe Leu Gly Ala Gly Tyr 

AAT TCT CAA AAA CAA GCC ACT AAC GCT ACT ATC 
Asn Ser Gin Lys Gin Ala Thr Asn Ala Thr lie 

TTC TTT GGG AAA TAC TTT GGC TGT CGT GCT TAT 
Phe Phe Gly Lys Tyr Phe Gly Cys Arg Ala Tyr 

AGG CTT AAA AAC CCT AAC TAT AAC AGC GAA GTG 
Arg Leu Lys Asn Pro Asn Tyr Asn Ser Glu Val 

GAA ATC AAT CGC TTA ACG AGC CTT GCT GAT CCT 
Glu lie Asn Arg Leu Thr Ser Leu Ala Asp Pro 

GGG GCT ATG GAT TTA ATG GTT AAT GTC ATC AAT 
Gly Ala Met Asp Leu Met Val Asn Val lie Asn 

GTG CAA TTG GCC GGC AAT TCA TGG CTT ATG GCG 
Val Gin Leu Ala Gly Asn Ser Trp Leu Met Ala 

GCT TTG GTG AGT AAA AAA GCC ACT TCT TTC CAA 
Ala Leu Val Ser Lys Lys Ala Thr Ser Phe Gin 

TTA AAG CAT TCC AGC ATT GAA GCG GGC GTG AAA 
Leu Lys His Ser Ser lie Glu Ala Gly Val Lys 

GCA AAA AAT TTG GAT ATA GGG TTT AGG CGC GTG 
Ala Lys Asn Leu Asp He Gly Phe Arg Arg Val 

TAG 



TTG ATT GTG TCT ATG AAC GCG CTA CTG GCC ATG 
Leu lie Val Ser Met Asn Ala Leu Leu Ala Met 

TTG CAA GGG CAA GCC CAA ATG CAT GCG GAT ATT 
Leu Gin Gly Gin Ala Gin Met His Ala Asp He 

AAA GGC TTT GAT GCG CTT TTA GGG TAT CAA TTT 
Lys Gly Phe Asp Ala Leu Leu Gly Tyr Gin Phe 

GGG TTT TTT GAC TAC GCT CAT GCC AAT TCT ATT 
Gly Phe Phe Asp Tyr Ala His Ala Asn Ser He 

GCG CAA TTG GCG GGT CAA ATT CTT GGG AAA CAA 
Ala Gin Leu Ala Gly Gin He Leu Gly Lys Gin 

AAA ACC TTT GAG CCA AAC ATG CTC ACT TAT GGG 
Lys Thr Phe Glu Pro Asn Met Leu Thr Tyr Gly 

AAC GGT ATC ATC AGT TTG GGG GCT TTT GGT GGG 
Asn Gly He He Ser Leu Gly Ala Phe Gly Gly 

ACA CCG AGC TTT GAA GGC ATT TTA GTG GAG CAA 
Thr Pro Ser Phe Glu Gly He Leu Val Glu Gin 

TTT TTA TTC AAT GTG GGG GCT CGC TTA AGG ATC 
Phe Leu Phe Asn Val Gly Ala Arg Leu Arg He 

TTC CCC ATG CTA AAG AAA AAC CCC TAT ATC ACT 
Phe Pro Met Leu Lys Lys Asn Pro Tyr lie Thr 

TAT TCG TGG TAT GTG AAT TAT GTG TTC ACT TTC 
Tyr Ser Trp Tyr Val Asn Tyr Val Phe Thr Phe 



HPC176 

ATG TTA GGG AAA AAA AAC GAG GAA GTC TTG ATT 
Met Leu Gly Lys Lys Asn Glu Glu Val Leu He 

GAT AGA TTG GCA AAA CTC AAT AAG GCC AAT AGG 
Asp Arg Leu Ala Lys Leu Asn Lys Ala Asn Arg 

CTC AAT GTT GCC GCT GTA ACG AGT ATT GTG ATG 
Leu Asn Val Ala Ala Val Thr Ser He Val Met 

TAT GGC ATT GAT CGA TAC ACA GGA GAA TTT AAA 
Tyr Gly He Asp Arg Tyr Thr Gly Glu Phe Lys 

AAT TCT GAA GCT GTT GTG GAT AGT GCA ACT TCA 
Asn Ser Glu Ala Val Val Asp Ser Ala Thr Ser 

AAT TCT TTG AGG GAT CGC AAG GAT CAA TTA ATG 
Asn Ser Leu Arg Asp Arg Lys Asp Gin Leu Met 

ATG AGA ATG TTC AAT GAA AAT ATC AGA CAA TTC 
Met Arg Met Phe Asn Glu Asn He Arg Gin Phe 

TCT AAC ATA CAA AGA GAA AAA GTC AAA AAT AGT 
Ser Asn He Gin Arg Glu Lys Val Lys Asn Ser 

AAA ATC ACA CCG 
Lys He Thr Pro 



GAT GAA AAT TTG GTT GGG GGT GTG ATA GCC CTT 
Asp Glu Asn Leu Val Gly Gly Val He Ala Leu 

ACT TTC AAA AGG GCT TTT TAT CTC TCT ATG GTG 
Thr Phe Lys Arg Ala Phe Tyr Leu Ser Met Val 

ATG ATG CCT TTG AAG AAA ACG GAT ATA TTT GTT 
Met Met Pro Leu Lys Lys Thr Asp He Phe Val 

ATT GTC AAA CGC TCC GAT GCT AGA CAA ATT GTC 
He Val Lys Arg Ser Asp Ala Arg Gin He Val 

AAA TTT GTC TCA TTG CTG TTT GGT TAT AGC AAA 
Lys Phe Val Ser Leu Leu Phe Gly Tyr Ser Lys 

CAG TAT TGC GAT GTG AGT TTC CAA ACC CAA GCA 
Gin Tyr Cys Asp Val Ser Phe Gin Thr Gin Ala 

GTA GAT AAA GTC CGA GCA GAA GCT ATC ATT AGC 
Val Asp Lys Val Arg Ala Glu Ala He He Ser 

CCC TTA ACG AGA TTA GCA TTT TTC ATT ACC ATC 
Pro Leu Thr Arg Leu Ala Phe Phe He Thr He 
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HPC180 

ATG AAA ACC TTT AAA AAC CTG 
Met Lys Thr Phe Lys Asn Leu 

TTG GAT AAT TTC ACT AGG GCC 
Leu Asp Asn Phe Thr Arg Ala 

GTC AAT AGC GCT AAC CCT ACT 
Val Asn Ser Ala Asn Pro Thr 

ATT GAT TGT AAA GTC TTA AAA 
He Asp Cys Lys Val Leu Lys 

ATT TAT GGC GTG AGC GTG TTG 
He Tyr Gly Val Ser Val Leu 

TTT AAA ACA GAC ACT CGA TTA 
Phe Lys Thr Asp Thr Arg Leu 

TTT GAT AGG GGG CAT TTT GTG 
Phe Asp Arg Gly His Phe Val 

ACT TAC AGA ATG ACT AAT ATC 
Thr Tyr Arg Met Thr Asn He 

GAA AAA GAG GGC SGT AAT TTG 
Glu Lys Glu Gly ? Asn Leu 

AAA CAG GGT TAT AGG ACT TTT 
Lys Gin Gly Tyr Arg Thr Phe 

GAT ACA AGG CTA ACG GAC AGC 
Asp Thr Arg Leu Thr Asp Ser 

CAA AAC TAT CCC TTA CAA GAA 
Gin Asn Tyr Pro Leu Gin Glu 

GTT TTT AAG AAC AAT AAA AAC 
Val Phe Lys Asn Asn Lys Asn 

TAT TAA 

Tyr 



CTC TGT TTT AGC CTG ATC GCT 
Leu Cys Phe Ser Leu He Ala 

ATT AAC AGC TAC ACC ACT AAA 
He Asn Ser Tyr Thr Thr Lys 

AAA AAT CAC AAT ACC ACT TAT 
Lys Asn His Asn Thr Thr Tyr 

AAT AAC TTC TAT TCG GTG TGT 
Asn Asn Phe Tyr Ser Val Cys 

TTT GGG GAT TTA GTG GAT AAA 
Phe Gly Asp Leu Val Asp Lys 

GCC AAA TAC CAA CAA GCC ACG 
Ala Lys Tyr Gin Gin Ala Thr 

GCG AAT GAC GCT TCT TTT GAT 
Ala Asn Asp Ala Ser Phe Asp 

ACC CCT GAA GCC AAA AAC ACC 
Thr Pro Glu Ala Lys Asn Thr 

GCC AGG AAA TAC CAT CAA GTT 
Ala Arg Lys Tyr His Gin Val 

AGC CCT AAA AWT ATC GCT ATT 
Ser Pro Lys ? He Ala He 

TAT GAA AAC GCT AAA AGC GAA 
Tyr Glu Asn Ala Lys Ser Glu 

ATG AGA AAA GAT TGT AAA GGA 
Met Arg Lys Asp Cys Lys Gly 

ACT GAG TTG AAC GAA TTG CCT 
Thr Glu Leu Asn Glu Leu Pro 



ATG AGT TGG CTC CAA GCG GAC ATG 
Met Ser Trp Leu Gin Ala Asp Met 

AAG CTT AAT GAA ATC AAG GAT CAA 
Lys Leu Asn Glu He Lys Asp Gin 

AAC GCT AAT GGC ATG CTC ATT AAC 
Asn Ala Asn Gly Met Leu He Asn 

TAT TCT AGC GAG TTA AAA AAC CCT 
Tyr Ser Ser Glu Leu Lys Asn Pro 

AAT AAT ATT GAA AAA CGC TAT GAG 
Asn Asn He Glu Lys Arg Tyr Glu 

ACA CAA GAT TAC ACC AGA AGC GGT 
Thr Gin Asp Tyr Thr Arg Ser Gly 

TTT GCG TCT AAC CCT TTA AGA GAG 
Phe Ala Ser Asn Pro Leu Arg Glu 

AAT AGG CAT TCT GTT TTA TTG GTA 
Asn Arg His Ser Val Leu Leu Val 

TTR GTA GAA GAA CTC ACC ATC ATC 
? Val Glu Glu Leu Thr He He 

CCT AGC GGC TTT TGG TAC CAC TAT 
Pro Ser Gly Phe Trp Tyr His Tyr 

TGC TTT TAT ATC CCT AAT GAC AAC 
Cys Phe Tyr He Pro Asn Asp Asn 

TAT GAG CGC GTT GAA AAG CAG GTG 
Tyr Glu Arg Val Glu Lys Gin Val 

AAG TAT TTT AAC AAC GCT AAG AAG 
Lys Tyr Phe Asn Asn Ala Lys Lys 
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HPC187 

T TGT ATT TTT TAT TGG CTC TTT TTT ACG ACT CCT TAC ATT GTA GGC GAT ATT TTG CAA TTG AAA TTT 
Cys lie Phe Tyr Trp Leu Phe Phe Thr Thr Pro Tyr He Val Gly Asp He Leu Gin Leu Lys Phe 

ATC CGT CAA AAG CTC TGC GAG AAG CCC GTT TTA CTC CCA CAA AAG GAT TAT GAA GAA GCG GGA AAT 
He Arg Gin Lys Leu Cys Glu Lys Pro Val Leu Leu Pro Gin Lys Asp Tyr Glu Glu Ala Gly Asn 

TAT GCC ATT AGG AAA ATG CAA TTA TCC ATT ATT TCT CAA ATT TTA GAC GGG ATA ATC TTT GCT GGT 
Tyr Ala He Arg Lys Met Gin Leu Ser He lie Ser Gin He Leu Asp Gly He He Phe Ala Gly 

TGG GTC TTT TTT GGT TTG ACG CAT TTA GAA GAT TTG ACG CAT TAT TTA AAC CTT CCT GAA ACG CTA 
Trp Val Phe Phe Gly Leu Thr His Leu Glu Asp Leu Thr His Tyr Leu Asn Leu Pro Glu Thr Leu 

GGT TAC TTG GTG TTT GCC TTG TTG TTT TTA GCG ATT CAA AGC GTT TTA GCT TTA CCC ATT AGC TAC 
Gly Tyr Leu Val Phe Ala Leu Leu Phe Leu Ala He Gin Ser Val Leu Ala Leu Pro He Ser Tyr 

TAC ACC ACC ATG CAT TTG GAT AAG GAA TTT GGC TTT TCT AAG GTG AGT TTA TCG TTG TTT TTC AAG 
Tyr Thr Thr Met His Leu Asp Lys Glu Phe Gly Phe Ser Lys Val Ser Leu Ser Leu Phe Phe Lys 

GAT TTT TTC AAA GGG TTA TCG CTC ACT TTA AGC GTG GGG TTG TTG TTG ATT TAC ACT CTT ATT ATG 
Asp Phe Phe Lys Gly Leu Ser Leu Thr Leu Ser Val Gly Leu Leu Leu He Tyr Thr Leu He Met 

ATC ATT GAA CAT GTG GAG CAT TGG GAG ATT AGC TCA TTT TTT GTC GTG TTT GTT TTT ATG ATA TTA 
He He Glu His Val Glu His Trp Glu He Ser Ser Phe Phe Val Val Phe Val Phe Met He Leu 

GCT AAT CTT TTT TAC CCT AAA ATC GCT CAG CTT TTC AAC CAA TTC ACC CCC TTG AAT AAT AGG GAT 
Ala Asn Leu Phe Tyr Pro Lys He Ala Gin Leu Phe Asn Gin Phe Thr Pro Leu Asn Asn Arg Asp 

TTG GAG AGT CAA ATT GAG AGC ATG ATG GAT AAG GTG GGT TTT AAA TCC GAA GGC ATT TTT GTG ATG 
Leu Glu Ser Gin He Glu Ser Met Met Asp Lys Val Gly Phe Lys Ser Glu Gly He Phe Val Met 

GAC GCT AGC AAG AGG GAT GGG CGT TTG AAT GCG TAT TTT GGG GGC TTG GGT AAA AAC AAG CGG GTG 
Asp Ala Ser Lys Arg Asp Gly Arg Leu Asn Ala Tyr Phe Gly Gly Leu Gly Lys Asn Lys Arg Val 

GTG TTG TTT GAC ACT TTG ATT TCT AAA GTT GGG ACA GAA GGG CTT TTA GCC ATT TTA GGG CAT GAA 
Val Leu Phe Asp Thr Leu He Ser Lys Val Gly Thr Glu Gly Leu Leu Ala He Leu Gly His Glu 

TTA GGG CAT TTT AAA AAT AAG GAT TTG TTG AAA AGT TTA GGG ATT ATG GGA GGC TTG CTC GCT; CTT 
Leu Gly His Phe Lys Asn Lys Asp Leu Leu Lys Ser Leu Gly He Met Gly Gly Leu Leu Ala Leu 

GTT TTT GCT CTG ATC GCT CAT TTG CCA CCG ATC GTT TTT GAA GGC TTT AAT GTC TCA CAA ACG CCA 
Val Phe Ala Leu He Ala His Leu Pro Pro He Val Phe Glu Gly Phe Asn Val Ser Gin Thr Pro 

GCG AGT TTG ATT ACG ATT TTA CTC TTG TTT TTG CCG GTG TTT TCC TTT TAC GCC ATG CCT TTG ATC 
Ala Ser Leu He Thr He Leu Leu Leu Phe Leu Pro Val Phe Ser Phe Tyr Ala Met Pro Leu He 

GGG TTT TTT AGC CGA AAG AAT GAA TAC AAT GCG GAC AAG TTT GGG GCG AGT TTA AGC TCT AAA GAG 
Gly Phe Phe Ser Arg Lys Asn Glu Tyr Asn Ala Asp Lys Phe Gly Ala Ser Leu Ser Ser Lys Glu 

GTT TTA GCC AAA GCG 
Val Leu Ala Lys Ala 



HPC189 



TTG 
Met 


GAA 
Glu 


TCC 
Ser 


TAT 
Tyr 


GGG 
Gly 


TTG 
Leu 


GCT 
Ala 


TGC 
Cys 


TCT 
Ser 


GAC 
Asp 


CGC 
Arg 


AGG 
Axg 


ATT 
He 


ATT 
He 


GCA 
Ala 


GGA 
Gly 


TTA 
Leu 


GTT 

val 


GGA 
Gly 


ATA 
He 


GTC 
Val 


AGA 
Arg 


TCA 
Ser 


ATC 
He 


TGG 
Trp 


AGC 
Ser 


TTT 
Phe 


TTT 
Phe 


AGT 
Ser 


TCA 
Ser 


AGA 
Arg 


TAT 
Tyr 


CAA 
Gin 


AGA 
Arg 


TCC 
Ser 


CAA 
Gin 


CAA 
Gin 


AAA 
Lys 


AAA 
Lys 


GAA 
Glu 


GTG 
Val 


GAT 
ASp 


AAG 
Lys 


AAT 
Asn 


TTA 
Leu 


CAT 
His 


CAA 
Gin 


ATT 
He 


TGT 
Cys 


GAA 
Glu 


AAA 
Lys 


ATT 
He 


GTG 
val 


CAG 
Gin 


GAT 
Asp 


GTG 
Val 


AAA 
Lys 


AGC 
Ser 


CGA 
Arg 


CTT 
Leu 


GAA 
Glu 


AGT 
Ser 


CGC 
Arg 


AAA 
Lys 


AAA 
Lys 


GAC 
Asp 


ATA 
He 


TGG 
Trp 


GAA 
Glu 


AAG 
Lys 


ATT 
He 


GAA 
Glu 


AAA 
Lys 


CTC 
Leu 


AAA 
Lys 


GCC 
Ala 


AAT 
Asn 


CTT 
Leu 


AGA 
Arg 


CCT 
Pro 


GTT 

val 


GAT 
Asp 


AAT 
Asn 


TAC 
Tyr 


GAA 
Glu 


CGC 
Arg 


ATG 
Met 


AAA 
Lys 


GGA 
Gly 


CAA 
Gin 


TTG 
Leu 


AAA 
Lys 


GAA 
Glu 


GCC 
Ala 


CAT 

His 


GAA 
Glu 


AAA 
Lys 


TTA 
Leu 


GGA 
Gly 


TAC 
Tyr 


ATC 
He 


TCT 

Ser 


CAT 
His 


AGT 
Ser 


ATC 
He 


CAT 
His 


CTA 
Leu 


ACA 
Thr 


ATA 
He 


TCA 
Ser 


AAA 


CAA 


GGA 


GCA 


TGC 


AAT 


GAA 


GAA 


TGA 





























Lys Sin Gly Ala Cys Asn Glu Glu 
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HPC19X 

GAT CAA AAA ACG GCT CAA AAA ATG CTC GCT 
Asp Gin Lys Thr Ala Gin Lys Met Leu Ala 

CAA GAG AAT GAA AAG GCT CAA AGC CCT TAT 
Gin Glu Asn Glu Lys Ala Gin Ser Pro Tyr 

CCT TAC TAT AGC CCT TAT TAT GGC ATG TAT 
Pro Tyr Tyr Ser Pro Tyr Tyr Gly Met Tyr 

GGC ATG TAC GGG TTC TAC CCT AAC ATG TTG 
Gly Met Tyr Gly Phe Tyr Pro Asn Met Leu 

AAT TAC ATG TAT GCA CTC GAT CAA GAA GAG 
Asn Tyr Met Tyr Ala Leu Asp Gin Glu Glu 

ACG CCT ACT GAT GAT GAC AGA GAC GAT AAG 
Thr Pro Thr Asp Asp Asp Arg Asp Asp Lys 

TTT TAT CGT GAT CCC AAA TTC AGC AAA GGC 
Phe Tyr Arg Asp Pro Lys Phe Ser Lys Gly 

TTA GAC AAC AGT CGC ATG CTC AAA GAC AAT 
Leu Asp Asn Ser Arg Met Leu Lys Asp Asn 

GTG GAT GCG ATA ACT TCT CAA GCC AAA GAG 
Val Asp Ala lie Thr Ser Gin Ala Lys Glu 

CAA GAT GGG GCG AGT CCT AGT AAG ATT GAT 
Gin Asp Gly Ala Ser Pro Ser Lys He Asp 

TTA GAC AAT AAT CTC AAC CAA TTA GAC AAT 
Leu Asp Asn Asn Leu Asn Gin Leu Asp Asn 

CAA GCC CAA GTG GAT AAA GCC CTA GAC AGC 
Gin Ala Gin Val Asp Lys Ala Leu Asp Ser 

AAT TAT TTA GAC GGG AGT TTG AAA ATT GAT 
Asn Tyr Leu Asp Gly Ser Leu Lys He Asp 

AAC CCC ATG CAA CAA CCT GCA CAA CAA ACG 
Asn Pro Met Gin Gin Pro Ala Gin Gin Thr 

AGC AAA GAT CAA GGG AGT AAC GCA CTC ATA 
Ser Lys Asp Gin Gly Ser Asn Ala Leu He 

ACC GAC GAT ACT CAC ACC GAC ACT AAC ACC 
Thr Asp Asp Thr His Thr Asp Thr Asn Thr 

GAT AAA GAT GCT AGC GGC AAC AAT ACC GGC 
Asp Lys Asp Ala Ser Gly Asn Asn Thr Gly 

GGT AAC ACT GAT GAT ATA AGC AAC ATG AAC 
Gly Asn Thr Asp Asp He Ser Asn Met Asn 

ATG GGT AAT AGC AAC GAC ATG GGC GAT GAC 
Met Gly Asn Ser Asn Asp Met Gly Asp Asp 



GAT TTG AGC GTG GTA GGG GCG TAT CTT AAA AAA CAA 
Asp Leu Ser Val Val Gly Ala Tyr Leu Lys Lys Gin 

TAC AGA AGC AAC AAC TAT TAC AAC TCT TAC TAT AGC 
Tyr Arg Ser Asn Asn Tyr Tyr Asn Ser Tyr Tyr Ser 

GGC ATG GGC ATG TAT GAT TTT TAT GAC TTT TAT GAT 
Gly Met Gly Met Tyr Asp Phe Tyr Asp Phe Tyr Asp 

TTT ATG ATG CAA GTT CAA GAT TAC TTG ATG TTA GAA 
Phe Met Met Gin Val Gin Asp Tyr Leu Met Leu Glu 

ATT TTA GAC CAT GAC GCT TCT AAT AAT CAA CTT GAT 
He Leu Asp His Asp Ala Ser Asn Asn Gin Leu Asp 

GAC GAT AAA TCC TTG CAG CAG GCA AAT CTT ATG AGC 
Asp Asp Lys Ser Leu Gin Gin Ala Asn Leu Met Ser 

ATT CAA ACC AAC CGC TTG AAT AGC GCT TTA GTC AAT 
He Gin Thr Asn Arg Leu Asn Ser Ala Leu Val Asn 

TCG CTT TTC CAC ACT AAA GCC ATG CCT ACT AAA AGC 
Ser Leu Phe His Thr Lys Ala Met Pro Thr Lys Ser 

CTT AAC CAT TTA GTG GGG CAA ATC AAA GAA ATG AAG 
Leu Asn His Leu Val Gly Gin He Lys Glu Met Lys 

TCA GTG GTT CAT AAA GCT ATG GAA GTG AGA GAC AAA 
Ser Val Val His Lys Ala Met Glu Val Arg Asp Lys 

GAC TTA AAA GAT CAA AAA GGG CTT TCA AGC GAG CAA 
Asp Leu Lys Asp Gin Lys Gly Leu Ser Ser Glu Gin 

GTG CAA CAA TTA AGC CAT AGC AGC GAT GTG GTG GGG 
Val Gin Gin Leu Ser His Ser Ser Asp Val Val Gly 

GGC GAT GAT AGA GAC GAT TTG AAT GAT GCG ATG AAT 
Gly Asp Asp Arg Asp Asp Leu Asn Asp Ala Met Asn 

CCT ATT AAC AAC ATG GAC AAC ACC CAT GCA AAT GAC 
Pro He Asn Asn Met Asp Asn Thr His Ala Asn Asp 

AAC CCT AAC AAC GCC ACT AAC ACC GAT GAC ACT CAC 
Asn Pro Asn Asn Ala Thr Asn Thr Asp Asp Thr His 

ACA AAC GAT ACC AGC ACT ACT GAC ACC CCC ACT GAT 
Thr Asn Asp Thr Ser Thr Thr Asp Thr Pro Thr Asp 

GAT ATG AAT AAC ACG GAC ACC GGC AAT ACT GAT AAC 
Asp Met Asn Asn Thr Asp Thr Gly Asn Thr Asp Asn 

AAC GGC AAC GAT GAT GCG GGT AAC GCT AAT GAC GAC 
Asn Gly Asn Asp Asp Ala Gly Asn Ala Asn Asp Asp 

ATG AAT AAT GCG AAC GAC ATG AAC GAT GAC ATG 
Met Asn Asn Ala Asn Asp Met Asn Asp Asp Met 
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SEQUENZPROTOKOLL 

(1) ALLGEMEINE ANGABEN: 

( i ) ANMELDER : 

(A) NAME: CREATOGEN Biosciences GmbH 

(B) STRASSE: Ulmer Strasse 160 a 

(C) ORT: Augsburg 

(E) LAND: DE 

( F ) POS TLE I TZAHL : 86156 

(A) NAME: Max-Planck-Gesellschaf t zur Foerderung der 

Wissenschaf ten e.V. 

(B) STRASSE: Hof gartenstrasse 2 

( C ) ORT : Muenchen 

(E) LAND: DE 

(F) POSTLEITZAHL: 80539 

(ii) BEZEI CHNUNG DER ERFINDUNG: Helicobacter- Proteine zur 
I dent i f i z i erung , 

Entwicklung und Optimierung von immunologischen und 
pharmakologischen Wirkstoffen 

(iii) ANZAHL DER SEQUENZEN: 114 

(iv) COMPUTER-LESBARE FAS SUNG : 

(A) DATENTRAGER: Floppy disk 

(B) COMPUTER: IBM PC compatible 

(C) BETRIEBSSYSTEM: PC-DOS/MS-DOS 

(D) SOFTWARE: Patentln Release #1.0 , Version #1.30 

(EPA) 

(2) ANGABEN ZU SEQ ID NO: 1: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 873 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: be ides 

(D) TOPOLOGIE: linear 

(vii) UNMITTELBARE HERKUNFT: 

(B) CLON(E) : HPS001 (HPS166) 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE : 1 . .873 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 1: 

ATG AAA TTT TTA CGC TCT GTT TAT GCA TTT TGC TCC AGT TGG GTA GGG 48 
Met Lys Phe Leu Arg Ser Val Tyr Ala Phe Cys Ser Ser Trp Val Gly 
IS 10 15 
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ACG ATT GTT ATT GTG CTG TTG GTT ATC TTT TTT ATC GCG CAA GCC TTT 96 
Thr He Val He Val Leu Leu Val He Phe Phe He Ala Gin Ala Phe 
20 25 30 

ATC ATT CCC TCT CGC TCT ATG GTT GGC ACG CTC TAT GAG GGC GAC ATG 144 
He He Pro Ser Arg Ser Met Val Gly Thr Leu Tyr Glu Gly Asp Met 
35 40 45 

CTC TTT GTC AAA AAG TTT TCT TAC GGC ATA CCC ATT CCT AAA ATC CCA 192 
Leu Phe Val Lys Lys Phe Ser Tyr Gly He Pro He Pro Lys He Pro 
50 55 60 

TGG ATT GAG CTT CCT GTT ATG CCT GAT TTT AAA AAT AAC GGA CAT TTG 240 
Trp He Glu Leu Pro Val Met Pro Asp Phe Lys Asn Asn Gly His Leu 
65 70 75 80 

ATA GAG GGG GAT CGC CCT AAG CGT GGC GAA GTG GTG GTG TTT ATC CCT 2 88 

He Glu Gly Asp Arg Pro Lys Arg Gly Glu Val Val Val Phe He Pro 
85 90 95 

CCC CAT GAA AAA AAG TCT TAC TAT GTT AAA AGG AAT TTT GCC ATT GGA 336 
Pro His Glu Lys Lys Ser Tyr Tyr Val Lys Arg Asn Phe Ala He Gly 
100 105 110 

GGC GAT GAG GTG TTG TTC ACT AAT GAG GGT TTT TAT TTG CAC CCT TTT 384 
Gly Asp Glu Val Leu Phe Thr Asn Glu Gly Phe Tyr Leu His Pro Phe 
115 120 125 

GAG AGC GAC ACG GAC AAA AAT TAC ATC GCT AAA CAT TAC CCT AAC GCC 432 
Glu Ser Asp Thr Asp Lys Asn Tyr He Ala Lys His Tyr Pro Asn Ala 
130 135 140 

ATG ACA AAA GAA TTT ATG GGT AAA ATT TTT GTT TTA AAC CCT TAT AAA 480 
Met Thr Lys Glu Phe Met Gly Lys He Phe Val Leu Asn Pro Tyr Lys 
145 150 155 160 

AAT GAG CAT CCG GGT ATC CAT TAC CAA AAA GAC AAT GAA ACC TTC CAC 528 
Asn Glu His Pro Gly He His Tyr Gin Lys Asp Asn Glu Thr Phe His 
165 170 175 

TTA ATG GAG CAA TTA GCC ACT CAA GGC GCA GAA GCT AAT ATC AGC ATG 576 
Leu Met Glu Gin Leu Ala Thr Gin Gly Ala Glu Ala Asn He Ser Met 
180 185 190 

CAA CTC ATT CAA ATG GAG GGC GAA AAG GTG TTT TAT AAG AAA ATC AAT 624 
Gin Leu He Gin Met Glu Gly Glu Lys Val Phe Tyr Lys Lys He Asn 
195 200 205 

GAC GAT GAA TTT TTC ATG ATC GGC GAC AAC AGA GAC AAT TCT AGC GAC 672 
Asp Asp Glu Phe Phe Met He Gly Asp Asn Arg Asp Asn Ser Ser Asp 
210 215 220 

TCG CGC TTT TGG GGG AGT GTG GCT TAT AAA AAC ATC GTG GGT TCG CCA 720 
Ser Arg Phe Trp Gly Ser Val Ala Tyr Lys Asn He Val Gly Ser Pro 
225 230 235 240 

TGG TTT GTT TAT TTC AGT TTG AGT TTA AAA AAT AGC CTA GAA ATG GAT 768 
Trp Phe Val Tyr Phe Ser Leu Ser Leu Lys Asn Ser Leu Glu Met Asp 
245 250 255 

GCA GAA AAT AAC CCT AAA AAA CGC TAT CTG GTG CGT TGG GAA CGC ATG 816 
Ala Glu Asn Asn Pro Lys Lys Arg Tyr Leu Val Arg Trp Glu Arg Met 
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260 265 270 

TTT AAA AGC GTT GGA GGC TTA GAA AAA ATC ATT AAA AAA GAA AAC GCA 864 
Phe Lys Ser Val Gly Gly Leu Glu Lys lie lie Lys Lys Glu Asn Ala 
275 280 285 

ACG CAT TAA 873 
Thr His * 
290 

(2) ANGABEN ZU SEQ ID NO: 2: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE : 291 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE : linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG : SEQ ID NO : 2: 

Met Lys Phe Leu Arg Ser Val Tyr Ala Phe Cys Ser Ser Trp Val Gly 
15 10 15 

Thr lie Val lie Val Leu Leu Val lie Phe Phe lie Ala Gin Ala Phe 
20 25 30 

He He Pro Ser Arg Ser Met Val Gly Thr Leu Tyr Glu Gly Asp Met 
35 40 45 

Leu Phe Val Lys Lys Phe Ser Tyr Gly He Pro He Pro Lys He Pro 
50 55 60 

Trp He Glu Leu Pro Val Met Pro Asp Phe Lys Asn Asn Gly His Leu 
65 70 75 80 

He Glu Gly Asp Arg Pro Lys Arg Gly Glu Val Val Val Phe He Pro 
85 90 95 

Pro His Glu Lys Lys Ser Tyr Tyr Val Lys Arg Asn Phe Ala He Gly 
100 105 110 

Gly Asp Glu Val Leu Phe Thr Asn Glu Gly Phe Tyr Leu His Pro Phe 
115 120 125 

Glu Ser Asp Thr Asp Lys Asn Tyr He Ala Lys His Tyr Pro Asn Ala 
130 135 140 

Met Thr Lys Glu Phe Met Gly Lys He Phe Val Leu Asn Pro Tyr Lys 
145 150 155 160 

Asn Glu His Pro Gly He His Tyr Gin Lys Asp Asn Glu Thr Phe His 
165 170 175 

Leu Met Glu Gin Leu Ala Thr Gin Gly Ala Glu Ala Asn He Ser Met 
180 185 190 

Gin Leu He Gin Met Glu Gly Glu Lys Val Phe Tyr Lys Lys He Asn 
195 200 205 

Asp Asp Glu Phe Phe Met He Gly Asp Asn Arg Asp Asn Ser Ser Asp 
210 215 220 
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Ser Arg Phe Trp Gly Ser Val Ala Tyr Lys Asn He Val Gly Ser Pro 
225 230 235 240 

Trp Phe Val Tyr Phe Ser Leu Ser Leu Lys Asn Ser Leu Glu Met Asp 
245 250 255 

Ala Glu Asn Asn Pro Lys Lys Arg Tyr Leu Val Arg Trp Glu Arg Met 
260 265 270 

Phe Lys Ser Val Gly Gly Leu Glu Lys He He Lys Lys Glu Asn Ala 
275 280 285 

Thr His * 
290 

(2) ANGABEN ZU SEQ ID NO: 3: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 267 Basenpaare 

(B) ART: Nuc-leotid 

(C) STRANG FORM : beides 

(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT : 
(B) CLON(E) : HPC003 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE:1..267 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 3: 

ATG GAA TCA CAA CTC ATG AAA CTC GCC ATT GAG ACT TAT AAA ATC ACT 48 
Met Glu Ser Gin Leu Met Lys Leu Ala He Glu Thr Tyr Lys He Thr 
295 300 305 

TTG ATG ATT TCT TTA CCG GTA TTA TTA GCG GGC TTA GTG GTG GGG CTA 96 
Leu Met He Ser Leu Pro Val Leu Leu Ala Gly Leu Val Val Gly Leu 
310 315 320 

TTA GTC AGT ATT TTT CAA GCG ACC ACT CAA ATC AAT GAA ATG ACC TTG 144 
Leu Val Ser He Phe Gin Ala Thr Thr Gin He Asn Glu Met Thr Leu 
325 330 335 

TCT TTT GTG CCT AAG ATT TTA GCC GTG ATT GGG GTG CTG ATT TTA ACC 192 
Ser Phe Val Pro Lys He Leu Ala Val He Gly Val Leu He Leu Thr 
340 345 350 355 

ATG CCG TGG ATG ACT AAC ATG CTT TTA GAT TAC ACC AAA ACC TTA ATC 240 
Met Pro Trp Met Thr Asn Met Leu Leu Asp Tyr Thr Lys Thr Leu He 
360 365 370 

AAG CTC ATT CCT AAA ATC ATA GGC TAG 267 
Lys Leu He Pro Lys He He Gly * 
375 380 



(2) ANGABEN ZU SEQ ID NO : 4: 
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( i ) SEQUENZKENNZE I CHEN : 

(A) LANGE : 89 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUEN2BESCHREIBUNG: SEQ ID NO: 4: 

Met Glu Ser Gin Leu Met Lys Leu Ala lie Glu Thr Tyr Lys lie Thr 
15 10 15 

Leu Met lie Ser Leu Pro Val Leu Leu Ala Gly Leu Val Val Gly Leu 
20 25 30 

Leu Val Ser lie Phe Gin Ala Thr Thr Gin lie Asn Glu Met Thr Leu 
35 40 45 

Ser Phe Val Pro Lys He Leu Ala Val He Gly Val Leu He Leu Thr 
50 55 60 

Met Pro Trp Met Thr Asn Met Leu Leu Asp Tyr Thr Lys Thr Leu He 
65 70 75 80 

Lys Leu He Pro Lys He He Gly * 
85 

(2) ANGABEN ZU SEQ ID NO: 5: 



{ i ) SEQUENZKENNZE I CHEN : 

(A) LANGE: 714 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT: 
(B) CLON(E) : HPC005 



(ix) MERKMAL: 

(A) NAME/ SCHLUSSEL : CDS 

(B) LAGE:1..714 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 5: 



ATG CCT ATT AAC CCT CTC TAT CTT TTC CCT AAT CTT TTT ACC GCT AGC 48 
Met Pro He Asn Pro Leu Tyr Leu Phe Pro Asn Leu Phe Thr Ala Ser 
90 95 100 105 



AGT ATT TTT TTA GGC ATG ATG AGT ATT TTT TAC GCT TCC AGT TAC CAA 96 
Ser He Phe Leu Gly Met Met Ser He Phe Tyr Ala Ser Ser Tyr Gin 
110 115 120 

TTT GTC ATG GCG TGT TGG TTA GTG GTA GCG AGC CTT ATT TTA GAC GGG 144 
Phe Val Met Ala Cys Trp Leu Val Val Ala Ser Leu He Leu Asp Gly 
125 130 135 



CTT GAT GGG CGT GTC GCA AGG CTT ACC AAC ACC ACC AGC AAG TTT GGT 192 
Leu Asp Gly Arg Val Ala Arg Leu Thr Asn Thr Thr Ser Lys Phe Gly 
140 145 150 



WO 00/73502 



PCT7EP00/05024 



ATA GAA TTT GAC TCA CTG GCT GAT GTA ATC GCT TTT GGG GTA GCC CCA 240 
lie Glu Phe Asp Ser Leu Ala Asp Val He Ala Phe Gly Val Ala Pro 
155 160 165 

AGC TTA ATC ACT TAC TTT TAT GTG GGG TAT AAC TTT GGG CGC ATA GGC 288 
Ser Leu He Thr Tyr Phe Tyr Val Gly Tyr Asn Phe Gly Arg He Gly 
170 175 180 185 

ATG GCG GTG AGC GCG TTG TTT GTG ATT TTT GGA GCG ATA CGA TTG GCA 336 
Met Ala Val Ser Ala Leu Phe Val He Phe Gly Ala He Arg Leu Ala 
190 195 200 

CGA TTC AAT ATC AGC ACC AAC ACA AGC GAC CCC TAT TCT TTT ATC GGT 3 84 

Arg Phe Asn He Ser Thr Asn Thr Ser Asp Pro Tyr Ser Phe He Gly 
205 210 215 

ATC CCC ATT CCT GCG GCG GCG GTA TTG GTG GTG CTT TGT GTG TTA TTG 432 
He Pro He Pro Ala Ala Ala Val Leu Val Val Leu Cys Val Leu Leu 
220 225 230 

GAT AAC AAA TAC CAT TTT TTA GAA GGA AAT ACC GAA AAG TTA TTT TTA 480 
Asp Asn Lys Tyr His Phe Leu Glu Gly Asn Thr Glu Lys Leu Phe Leu 
235 240 245 

AGC TTT ATT GTT TTA TTG GGG GTG CTT ATG GTG AGC AAT ATC CGC TAC 528 
Ser Phe He Val Leu Leu Gly Val Leu Met Val Ser Asn He Arg Tyr 
250 255 260 265 

CCT AAT TTT AAA AAA GTC AAA TGG AAT CTC AAG CTT TTT ATC TTA GTG 576 
Pro Asn Phe Lys Lys Val Lys Trp Asn Leu Lys Leu Phe He Leu Val 
270 275 280 

TTG ATT TTT TTA TCG TTA GTG TTT GTG CGC CCT TTA GAG GCT TTA AGC 624 
Leu He Phe Leu Ser Leu Val Phe Val Arg Pro Leu Glu Ala Leu Ser 
285 290 295 

GTG TTT ATG GGG TTG TAT TTG ATT TAT GGC ATC ATT CGG TGG CTT TTT 672 
Val Phe Met Gly Leu Tyr Leu He Tyr Gly He He Arg Trp Leu Phe 
300 305 310 

TTA ATG GTA AAA ATT ATT TTT AAT AAA AAT AAA AGT GCA TGA 714 
Leu Met Val Lys He He Phe Asn Lys Asn Lys Ser Ala * 
315 320 32S 



(2) ANGABEN ZU SEQ ID NO: 6: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 238 Aminosauren 

(B) ART : Aminos&ure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 6: 

Met Pro He Asn Pro Leu Tyr Leu Phe Pro Asn Leu Phe Thr Ala Ser 
1 5 10 15 

Ser He Phe Leu Gly Met Met Ser He Phe Tyr Ala Ser Ser Tyr Gin 
20 25 30 

Phe Val Met Ala Cys Trp Leu Val Val Ala Ser Leu He Leu Asp Gly 
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35 40 45 

Leu Asp Gly Arg Val Ala Arg Leu Thr Asn Thr Thr Ser Lys Phe Gly 
50 55 60 

lie Glu Phe Asp Ser Leu Ala Asp Val lie Ala Phe Gly Val Ala Pro 
65 70 75 80 

Ser Leu lie Thr Tyr Phe Tyr Val Gly Tyr Asn Phe Gly Arg lie Gly 
85 90 95 

Met Ala Val Ser Ala Leu Phe Val He Phe Gly Ala He Arg Leu Ala 
100 105 110 

Arg Phe Asn He Ser Thr Asn Thr Ser Asp Pro Tyr Ser Phe He Gly 
115 120 125 

He Pro He Pro Ala Ala Ala Val Leu Val Val Leu Cys Val Leu Leu 
130 135 140 

Asp Asn Lys Tyr His Phe Leu Glu Gly Asn Thr Glu Lys Leu Phe Leu 
145 150 155 160 

Ser Phe He Val Leu Leu Gly Val Leu Met Val Ser Asn He Arg Tyr 
165 170 175 

Pro Asn Phe Lys Lys Val Lys Trp Asn Leu Lys Leu Phe lie Leu Val 
180 185 190 

Leu He Phe Leu Ser Leu Val Phe Val Arg Pro Leu Glu Ala Leu Ser 
195 200 205 

Val Phe Met Gly Leu Tyr Leu He Tyr Gly He He Arg Trp Leu Phe 
210 215 220 

Leu Met Val Lys He He Phe Asn Lys Asn Lys Ser Ala * 
225 230 235 

(2) ANGABEN ZU SEQ ID NO: 7: 

(i) S EQUENZ KENNZE I CHEN : 

(A) LANGE: 552 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: be ides 

(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT: 

(B) CLON(E) : HPC029 (HPC030) 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE:1..552 

(xi) SEQUENZBESCHREIBUNG : SEQ ID NO: 7: 



ATG GCA GAA GAA CAA GAA AAT ACC GCG CAA CAA CCC CAA AAA AAA AGC 
Met Ala Glu Glu Gin Glu Asn Thr Ala Gin Gin Pro Gin Lys Lys Ser 
240 245 250 



48 



WO 00/73502 



PCT/EP00/05024 



8 

AAA GCC CTT TTA TTT GTC ATT ATT GGA AGC GTG TTA GTG ATG CTT TTG 96 
Lys Ala Leu Leu Phe Val lie lie Gly Ser Val Leu Val Met Leu Leu 
255 260 265 270 

TTG GTG GGG GTG ATT ATC ATG CTG CTT ATG GGG AAT AAG GAA GAA TCC 144 
Leu Val Gly Val lie lie Met Leu Leu Met Gly Asn Lys Glu Glu Ser 
275 280 285 

AAA GAA AAC GCT TCT AAA AAC ACC CAA GAA GTC CAA GCT AAT CCT ATG 192 
Lys Glu Asn Ala Ser Lys Asn Thr Gin Glu Val Gin Ala Asn Pro Met 
290 295 300 

GCG AAC AAA AAT CAA GAA GCC AAA GAA GGC TCT AAT ATC CAG CAA TAT 240 
Ala Asn Lys Asn Gin Glu Ala Lys Glu Gly Ser Asn lie Gin Gin Tyr 
30S 310 315 

CTG GTG CTT GGG CCT TTG TAT GCG ATT GAT GCG CCT TTT GCG GTG AAT 288 
Leu Val Leu Gly Pro Leu Tyr Ala lie Asp Ala Pro Phe Ala Val Asn 
320 325 330 

TTG GTT TCT CAA AAT GGC AGA CGC TAC CTT AAG GCT TCC ATT TCG TTA 336 
Leu Val Ser Gin Asn Gly Arg Arg Tyr Leu Lys Ala Ser lie Ser Leu 
335 340 345 350 

GAA TTG AGC AAT GAA AAG CTT TTA AAT GAA GTC AAG GTT AAA GAC ACA 384 
Glu Leu Ser Asn Glu Lys Leu Leu Asn Glu Val Lys Val Lys Asp Thr 
355 360 365 

GCG ATT AAG GAC ACG ATT ATA GAG ATT CTA TCG TCT AAA AGC GTG GAA 432 
Ala lie Lys Asp Thr lie He Glu He Leu Ser Ser Lys Ser Val Glu 
370 375 380 

GAA GTG GTT ACT AAC AAA GGT AAA AAC AAG CTT AAA GAT GAA ATT AAG 480 
Glu Val Val Thr Asn Lys Gly Lys Asn Lys Leu Lys Asp Glu He Lys 
385 390 395 

AGC CAT TTG AAT TCG TTT TTG ATT GAT GGC TTT ATT AAA AAT GTC TTT 528 
Ser His Leu Asn Ser Phe Leu He Asp Gly Phe He Lys Asn Val Phe 
400 405 410 

TTC ACT GAT TTC ATT ATT CAA TAA 552 
Phe Thr Asp Phe He He Gin * 
415 420 

(2) ANGABEN ZU SEQ ID NO: 8: 

( i ) S E QUENZ KENNZ EI CHEN : 

(A) LANGE: 184 Aminosauren 
{ B ) ART : Ami no s aure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 8: 

Met Ala Glu Glu Gin Glu Asn Thr Ala Gin Gin Pro Gin Lys Lys Ser 
15 10 15 

Lys Ala Leu Leu Phe Val He He Gly Ser Val Leu Val Met Leu Leu 
20 25 30 

Leu Val Gly Val He lie Met Leu Leu Met Gly Asn Lys Glu Glu Ser 
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Lys Glu Asn Ala Ser Lys Asn Thr Gin Glu Val Gin Ala Asn Pro Met 
50 55 60 

Ala Asn Lys Asn Gin Glu Ala Lys Glu Gly Ser Asn lie Gin Gin Tyr 
65 70 75 80 

Leu Val Leu Gly Pro Leu Tyr Ala lie Asp Ala Pro Phe Ala Val Asn 
85 90 95 

Leu Val Ser Gin Asn Gly Arg Arg Tyr Leu Lys Ala Ser lie Ser Leu 
100 105 110 

Glu Leu Ser Asn Glu Lys Leu Leu Asn Glu Val Lys Val Lys Asp Thr 
115 120 125 

Ala lie Lys Asp Thr lie lie Glu He Leu Ser Ser Lys Ser Val Glu 
130 135 140 

Glu Val Val Thr Ash Lys Gly Lys Asn Lys Leu Lys Asp Glu He Lys 
145 150 155 160 

Ser His Leu Asn Ser Phe Leu He Asp Gly Phe He Lys Asn Val Phe 
165 170 175 

Phe Thr Asp Phe He He Gin * 
180 

(2) ANGABEN ZU SEQ ID NO: 9: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 858 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT : 
(B) CLON(E) : HPS042 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE:1..858 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 9: 

ATG AAA GAG TTT AAG ATT CTA ATC ATC CTC ATT GTG GTG GTA GGC GTG 48 
Met Lys Glu Phe Lys He Leu He He Leu He Val Val Val Gly Val 
185 190 195 200 

ATT TAT TAT GGG GTT GAG CCT TAT GCG CAT TCG GTG ATG CAC CCT AAA 96 
He Tyr Tyr Gly Val Glu Pro Tyr Ala His Ser Val Met His Pro Lys 
205 210 215 

GTC GCT CCG GCA GAT TTT GCT TTC AAG GAT TTA GAG CCG ATG GAT TTA 144 
Val Ala Pro Ala Asp Phe Ala Phe Lys Asp Leu Glu Pro Met Asp Leu 
220 225 230 

AAA AAT GGC GAT GCT AAT AAG GGC AAA CAG CTT GTA GCT GAA AAT TGC 192 
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Lys Asn Gly Asp Ala Asn Lys Gly Lys Gin Leu Val Ala Glu Asn Cys 
235 240 245 

ACC GCT TGC CAT GGC ATT AAA TCC CAA AAC ATT CCA GCC CCT ATG GAC 240 
Thr Ala Cys His Gly lie Lys Ser Gin Asn He Pro Ala Pro Met Asp 
250 255 260 

AGC CTT AGC GCG AGC AAC TCT TTT GGG GTC GTG CCA CCG GAT TTA AGC 288 
Ser Leu Ser Ala Ser Asn Ser Phe Gly Val Val Pro Pro Asp Leu Ser 
265 270 275 280 

CAT GTG GCG GGG GTT TTG AAC GCG AAT TTC TTA GCC CAC TTC ATC AAA 336 
His Val Ala Gly Val Leu Asn Ala Asn Phe Leu Ala His Phe He Lys 
285 290 295 

GAC CCT GTA AAA ACG GCG AAA TTG AGC CAT AAG TTC AAC GAT GAA AGG 384 
Asp Pro Val Lys Thr Ala Lys Leu Ser His Lys Phe Asn Asp Glu Arg 
300 305 310 

CCC TAT CCT ATG CCG GCG TTT TCT CAA TTT AGC GAT AAA GAC TTG AGC 432 
Pro Tyr Pro Met Pro Ala Phe Ser Gin Phe Ser Asp Lys Asp Leu Ser 
315 320 325 

GAT ATT GTG GCG TAT CTC ACT TCT ATT TTG CCT AAA AAT TTG AGC GAT 480 
Asp He Val Ala Tyr Leu Thr Ser He Leu Pro Lys Asn Leu Ser Asp 
330 335 340 

AAG GAA GTG TTC GCG CAA AGC TGT CAA AGG TGC CAT AGC TTG GAT TAT 528 
Lys Glu Val Phe Ala Gin Ser Cys Gin Arg Cys His Ser Leu Asp Tyr 
345 350 355 360 

GCG AAA GAT AAG GCC TTT AGC GAT CCT AAA GAT CTA GCC AAT TAT TTA 576 
Ala Lys Asp Lys Ala Phe Ser Asp Pro Lys Asp Leu Ala Asn Tyr Leu 
365 370 375 

GGC TCT CAT GCA CCT GAT TTG TCC ATG ATG ATT AGA GCT AAA GGC GAA 624 
Gly Ser His Ala Pro Asp Leu Ser Met Met He Arg Ala Lys Gly Glu 
380 385 390 

CAT GGT TTG AAT ATT TTC ATC AAC GAT CCG CAA. AAG CTT TTG CCT GGC 672 
His Gly Leu Asn He Phe He Asn Asp Pro Gin Lys Leu Leu Pro Gly 
395 400 405 

ACG GCT ATG CCC AGA GTG GGA TTG AGT GAA CAA GCT CAA AAA CAA GTC 720 
Thr Ala Met Pro Arg Val Gly Leu Ser Glu Gin Ala Gin Lys Gin Val 
410 415 420 

ATC GCA TAT TTG GAA AAA "GCA GGC GAT AGG AAA AAA CAT GAA AGG AAT 768 
He Ala Tyr Leu Glu Lys Ala Gly Asp Arg Lys Lys His Glu Arg Asn 
425 430 435 440 

ACC TTA GGG ATA AAA ATC ATG ATT TTC TTT GCG GTG CTG TCG TTC TTG 816 
Thr Leu Gly He Lys He Met He Phe Phe Ala Val Leu Ser Phe Leu 
445 450 455 

GCT TAT GCG TGG AAA AGA AAA GTT TGG AGC GAA GTG CAT TGA 858 
Ala Tyr Ala Trp Lys Arg Lys Val Trp Ser Glu Val His * 
460 465 470 



(2) ANGABEN ZU SEQ ID NO: 10: 
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(i) SEQUENZKENNZEICHEN : 

(A) LANGE: 286 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 10: 

Met Lys Glu Phe Lys lie Leu lie lie Leu lie Val Val Val Gly Val 
15 10 15 

lie Tyr Tyr Gly Val Glu Pro Tyr Ala His Ser Val Met His Pro Lys 
20 25 30 

Val Ala Pro Ala Asp Phe Ala Phe Lys Asp Leu Glu Pro Met Asp Leu 
35 40 45 

Lys Asn Gly Asp Ala Asn Lys Gly Lys Gin Leu Val Ala Glu Asn Cys 
50 55 60 

Thr Ala Cys His Gly lie Lys Ser Gin Asn lie Pro Ala Pro Met Asp 
65 70 75 80 

Ser Leu Ser Ala Ser Asn Ser Phe Gly Val Val Pro Pro Asp Leu Ser 
85 90 95 

His Val Ala Gly Val Leu Asn Ala Asn Phe Leu Ala His Phe lie Lys 
100 105 110 

Asp Pro Val Lys Thr Ala Lys Leu Ser His Lys Phe Asn Asp Glu Arg 
115 120 125 

Pro Tyr Pro Met Pro Ala Phe Ser Gin Phe Ser Asp Lys Asp Leu Ser 
130 135 140 

Asp lie Val Ala Tyr Leu Thr Ser lie Leu Pro Lys Asn Leu Ser Asp- 
145 150 155 160 

Lys Glu Val Phe Ala Gin Ser Cys Gin Arg Cys His Ser Leu Asp Tyr 
165 170 175 

Ala Lys Asp Lys Ala Phe Ser Asp Pro Lys Asp Leu Ala Asn Tyr Leu 
180 185 190 

Gly Ser His Ala Pro Asp Leu Ser Met Met He Arg Ala Lys Gly Glu 
195 200 205 

His Gly Leu Asn He Phe He Asn Asp Pro Gin Lys Leu Leu Pro Gly 
210 215 220 

Thr Ala Met Pro Arg Val Gly Leu Ser Glu Gin Ala Gin Lys Gin Val 
225 230 235 240 

He Ala Tyr Leu Glu Lys Ala Gly Asp Arg Lys Lys His Glu Arg Asn 
245 250 255 

Thr Leu Gly He Lys He Met He Phe Phe Ala Val Leu Ser Phe Leu 
260 265 270 

Ala Tyr Ala Trp Lys Arg Lys Val Trp Ser Glu Val His * 
275 280 285 
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(2) ANGABEN ZU SEQ ID NO: 11: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 192 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT: 

(B) CLON(E) : HPC057 (HPC109, HPC138) 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) IiAGE : 1 . .192 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 11: 

ATG AAT ACA GAA ATT TTA ACC ATC ATG TTA GTT GTC TCA GTG CTT ATG 48 
Met Asn Thr Glu lie Leu Thr lie Met Leu Val Val Ser Val Leu Met 
290 295 300 

GGA TTG GTA GGC TTA ATA GCG TTT TTG TGG GGG GTT AAA AGC GGT CAG 96 
Gly Leu Val Gly Leu lie Ala Phe Leu Trp Gly Val Lys Ser Gly Gin 
305 310 315 

TTT GAC GAT GAA AAA CGC ATG CTT GAA AGC GTG TTG TAT GAC AGC GTG 144 
Phe Asp Asp Glu Lys Arg Met Leu Glu Ser Val Leu Tyr Asp Ser Val 
320 325 330 

AGC GAT TTG AAC GAA GCG ATT TTA CAA GAA AAA CGC CAA AAG AAT TAA 192 
Ser Asp Leu Asn Glu Ala lie Leu Gin Glu Lys Arg Gin Lys Asn * 
335 340 345 350 

(2) ANGABEN ZU SEQ ID NO: 12: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 64 Minosauren 

(B) ART: Amino saure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 12: 

Met Asn Thr Glu lie Leu "Thr lie Met Leu Val Val Ser Val Leu Met 
15 10 15 

Gly Leu Val Gly Leu lie Ala Phe Leu Trp Gly Val Lys Ser Gly Gin 
20 25 30 

Phe Asp Asp Glu Lys Arg Met Leu Glu Ser Val Leu Tyr Asp Ser Val 
35 40 45 

Ser Asp Leu Asn Glu Ala lie Leu Gin Glu Lys Arg Gin Lys Asn * 
50 55 60 



(2) ANGABEN 



ZU SEQ ID NO: 13: 
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(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 957 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: be ides 

(D) TOPOLOGIE : linear 



(vii) UNMITTELBARE HERKUNFT: 

(B) CLON(E): HPS062 (HPS171) 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE:1..957 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 13: 



ATG CCC GAT TCT GCG AAC ATG ATC ATT TTA TTT TTC ACC TAT GAT ATT 4 8 

Met Pro Asp Ser Ala Asn Met lie lie Leu Phe Phe Thr Tyr Asp lie 
65 70 75 80 

TTA TTC GCT CTC AAT TAG ACC TTG CCC ATT TCC TTG CTT TTG GCG ATG 96 
Leu Phe Ala Leu Asn Tyr Thr Leu Pro lie Ser Leu Leu Leu Ala Met 

85 90 95 

GTT TTA TTT TAT ATC GCA TTC ATT AAA TCC AAC CAA TAC ACC GCC CTG 144 
Val Leu Phe Tyr lie Ala Phe lie Lys Ser Asn Gin Tyr Thr Ala Leu 
100 105 110 

CTC TCC ATT GGC TTT TCC AAA TGC CAG ATT TTA AGC CCT ATT TTT TTG 192 
Leu Ser lie Gly Phe Ser Lys Cys Gin lie Leu Ser Pro lie Phe Leu 
115 120 125 

ATT AGT CTG TTT TTC ACG GCT ATT TAT GTG GGG TTG AAC GCG ACT CCT 240 
lie Ser Leu Phe Phe Thr Ala lie Tyr Val Gly Leu Asn Ala Thr Pro 
130 135 140 

TTT GTG TAT ATG GAA GAA AAA ACG CAA AAT TTA ATC TAT AAA GAC AAT 288 
Phe Val Tyr Met Glu Glu Lys Thr Gin Asn Leu lie Tyr Lys Asp Asn 
145 150 155 160 

TCT TTG AGC GTC TCA GAG CAT TTG TTA GTG AAA TAT AAC GAT GAT TAC 336 
Ser Leu Ser Val Ser Glu His Leu Leu Val Lys Tyr Asn Asp Asp Tyr 
165 170 175 

GTG TAT TTT GAT AAG ATT AAT CCC CTA TTG CAA AAA GCC CAA AAC ATC 384 
Val Tyr Phe Asp Lys lie Asn Pro Leu Leu Gin Lys Ala Gin Asn He 
180 185 190 

AAG GTT TTT CGC CTA AAA GAT AAG ACT TTA GAA TCT TAC GCT GAA GCT 432 
Lys Val Phe Arg Leu Lys Asp Lys Thr Leu Glu Ser Tyr Ala Glu Ala 
195 200 205 

AAA GAA GCT TTT TTT GAA GAC AAG TAT TGG ATT TTG CAT GAC ACT ACT 480 
Lys Glu Ala Phe Phe Glu Asp Lys Tyr Trp He Leu His Asp Thr Thr 
210 215 220 

ATC TAT GAG ATG CCC TTG AGT TTT GAA CTG GGT GCA AAC GCT TTA AGC 528 
lie Tyr Glu Met Pro Leu Ser Phe Glu Leu Gly Ala Asn Ala Leu Ser 
225 230 235 240 
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ACC ACG CGT TTA AAA ACC TTT AAA ACG CTC AAA AAT TTC CGC CCT AAA 576 
Thr Thr Arg Leu Lys Thr Phe Lys Thr Leu Lys Asn Phe Arg Pro Lys 
245 250 255 

GTT TTA GAC ACC ATT TAT CAA AAC AAG CCC GCG GTT TCT ATC ACA GAC 624 
Val Leu Asp Thr lie Tyr Gin Asn Lys Pro Ala Val Ser lie Thr Asp 
260 265 270 

GCT CTT TTA TCT TTG CAT GCT TTA GTG CGC CAA AAC GCA GAC ACG AAA 672 
Ala Leu Leu Ser Leu His Ala Leu Val Arg Gin Asn Ala Asp Thr Lys 
275 280 285 

AAA GTG CGA TCG TTT TTG TAT GTG TTT GCG ATT TTG CCC TTT TTT GTG 720 
Lys Val Arg Ser Phe Leu Tyr Val Phe Ala lie Leu Pro Phe Phe Val 
290 295 300 

CCG TTT TTA AGC GTT TTA ATC GCT TAT TTT TCG CCC AGT CTC GCC CGC 768 
Pro Phe Leu Ser Val Leu lie Ala Tyr Phe Ser Pro Ser Leu Ala Arg 
305 310 315 320 

TAT GAA AAC CTG GCT CTT TTA GGG CTA AAG TTT ATC ATT ATC ACG CTC 816 
Tyr Glu Asn Leu Ala Leu Leu Gly Leu Lys Phe lie lie lie Thr Leu 
325 330 335 

GTT GTT TGG GGG CTA TTC TTT GCT TTA GGG AAG TTC AGC ATT TCA GGG 864 
Val Val Trp Gly Leu Phe Phe Ala Leu Gly Lys Phe Ser lie Ser Gly 
340 345 350 

ATA CTC ATT CCT GAA ATA GGC GTG CTA TCG CCC TTT TTT ATA TTC TTA 912 
lie Leu lie Pro Glu lie Gly Val Leu Ser Pro Phe Phe lie Phe Leu 
355 360 365 

GCT CTT AGT CTT TGG TAT TTT AAA AAG CTT AAT AAG AGG TTG TAG 957 
Ala Leu Ser Leu Trp Tyr Phe Lys Lys Leu Asn Lys Arg Leu * 
370 375 380 



(2) ANGABEN ZU SEQ ID NO: 14: 

(i) SEQUENZKENNZEICHEN : 

(A) LANGE: 319 Aminosauren 

(B) ART: Aminos aure 
(D) TOPOLOGIE: linear 

(ii> ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG : SEQ ID NO: 14: 

Met Pro Asp Ser Ala Asn Met lie lie Leu Phe Phe Thr Tyr Asp lie 
15 10 15 

Leu Phe Ala Leu Asn Tyr Thr Leu Pro lie Ser Leu Leu Leu Ala Met 
20 25 30 

Val Leu Phe Tyr lie Ala Phe lie Lys Ser Asn Gin Tyr Thr Ala Leu 
35 40 45 

Leu Ser lie Gly Phe Ser Lys Cys Gin lie Leu Ser Pro lie Phe Leu 
50 55 60 

lie Ser Leu Phe Phe Thr Ala lie Tyr Val Gly Leu Asn Ala Thr Pro 
65 70 75 80 
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Phe Val Tyr Met Glu Glu Lys Thr Gin Asn Leu lie Tyr Lys Asp Asn 
85 90 95 

Ser Leu Ser Val Ser Glu His Leu Leu Val Lys Tyr Asn Asp Asp Tyr 
100 105 110 

Val Tyr Phe Asp Lys lie Asn Pro Leu Leu Gin Lys Ala Gin Asn lie 
115 120 125 

Lys Val Phe Arg Leu Lys Asp Lys Thr Leu Glu Ser Tyr Ala Glu Ala 
130 135 140 

Lys Glu Ala Phe Phe Glu Asp Lys Tyr Trp lie Leu His Asp Thr Thr 
145 150 155 160 

lie Tyr Glu Met Pro Leu Ser Phe Glu Leu Gly Ala Asn Ala Leu Ser 
165 170 175 

Thr Thr Arg Leu Lys Thr Phe Lys Thr Leu Lys Asn Phe Arg Pro Lys 
180 185 190 

Val Leu Asp Thr lie Tyr Gin Asn Lys Pro Ala Val Ser lie Thr Asp 
195 200 205 

Ala Leu Leu Ser Leu His Ala Leu Val Arg Gin Asn Ala Asp Thr Lys 
210 215 220 

Lys Val Arg Ser Phe Leu Tyr Val Phe Ala lie Leu Pro Phe Phe Val 
225 230 235 240 

Pro Phe Leu Ser Val Leu lie Ala Tyr Phe Ser Pro Ser Leu Ala Arg 
.245 250 255 

Tyr Glu Asn Leu Ala Leu Leu Gly Leu Lys Phe He He He Thr Leu 
260 265 270 

Val Val Trp Gly Leu Phe Phe Ala Leu Gly Lys Phe Ser He Ser Gly 
275 280 285 

He Leu He Pro Glu He Gly Val Leu Ser Pro Phe Phe He Phe Leu 
290 295 300 

Ala Leu Ser Leu Trp Tyr Phe Lys Lys Leu Asn Lys Arg Leu * 
305 310 315 

(2) ANGABEN ZU SEQ ID NO: 15: 

(i) SEQUENZKENNZEICHEN : 

(A) LANGE: 1629 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: be ides 

(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT: 

(B) CLON(E) : HPS065 (HPS153) 



(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE:1..1629 
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(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 15: 

ATG AAT AAA CCA TTT TTA ATC TTA CTC ATA GCC CTA ATT GTC TTT AGC 48 
Met Asn Lys Pro Phe Leu lie Leu Leu lie Ala Leu lie Val Phe Ser 
320 325 330 335 

GGC TGT AAC ATG AGA AAA TAT TTC AAA CCC GCT AAA CAC CAA ATT AAA 96 
Gly Cys Asn Met Arg Lys Tyr Phe Lys Pro Ala Lys His Gin lie Lys 
340 345 350 

GGC GAA GCG TAT TTC CCT AAC CAT TTG CAA GAA AGT ATC GTT TCG TCT 144 
Gly Glu Ala Tyr Phe Pro Asn His Leu Gin Glu Ser lie Val Ser Ser 
355 360 365 

AAT CGT TAT GGA GCC ATT TTG AAA AAT GGA GCG GTT ATA GGC GAT AAA 192 
Asn Arg Tyr Gly Ala lie Leu Lys Asn Gly Ala Val lie Gly Asp Lys 
370 375 380 

GGT TTA ACG CAG CTA AGA ATC GGT AAG AAC TTC AAT TAC GAA AGC AGT 240 
Gly Leu Thr Gin Leu Arg lie Gly Lys Asn Phe Asn Tyr Glu Ser Ser 
385 390 395 

TTT TTA AAT GAG AGT CAA GGG TTT TTT ATT CTT GCG CAA GAT TGT TTG 288 
Phe Leu Asn Glu Ser Gin Gly Phe Phe lie Leu Ala Gin Asp Cys Leu 
400 405 410 415 

AAC AAG ATT GAT AAA AAA ACA AAC AAA AGC AAG GTG GCT AAG ACT GAA 336 
Asn Lys lie Asp Lys Lys Thr Asn Lys Ser Lys Val Ala Lys Thr Glu 
420 425 430 

GAA ACG GAA TTG AAA TTA AAG GGC GTT GAA GCG GAA GTC CAA GAT AAA 384 
Glu Thr Glu Leu Lys Leu Lys Gly Val Glu Ala Glu Val Gin Asp Lys 
435 440 445 

GTC TGT CAT CAA GTG GAA TTG ATT AGC AAT AAC CCT AAC GCC AGC CAA 432 
Val Cys His Gin Val Glu Leu lie Ser Asn Asn Pro Asn Ala Ser Gin 
450 455 460 

CAA TCT ATC GTT ATT CCT TTG GAG ACT TTT GCC TTG AGC GCA AGC GTT 480 
Gin Ser lie Val lie Pro Leu Glu Thr Phe Ala Leu Ser Ala Ser Val 
465 470 475 

AAA GGG AAT CTT TTA GCG GTG GTG TTA GCG GAC AAT TCA GCG AAC TTA 528 
Lys Gly Asn Leu Leu Ala Val Val Leu Ala Asp Asn Ser Ala Asn Leu 
480 485 490 495 

TAC GAC ATC ACT TCT CAA AAA TTG CTT TTT AGT GAG AAA GGT TCC CCA 576 
Tyr Asp He Thr Ser Gin Lys Leu Leu Phe Ser Glu Lys Gly Ser Pro 
500 505 510 

AGC ACC ACG ATC AAT TCT TTA ATG GCG ATG CCT ATT TTT ATG GAT ACG 624 
Ser Thr Thr He Asn Ser Leu Met Ala Met Pro He Phe Met Asp Thr 
515 520 525 

GTC GTG GTG TTC CCC ATG CTA GAT GGG CGC TTG TTG GTC GTG GAT TAT 672 
Val Val Val Phe Pro Met Leu Asp Gly Arg Leu Leu Val Val Asp Tyr 
530 535 540 

GTG CAC GGA AAC CCT ACG CCT ATT AGA AAC ATT GTT ATC AGC AGC GAT 720 
Val His Gly Asn Pro Thr Pro He Arg Asn He Val He Ser Ser Asp 
545 550 555 
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AAG TTT TTT AAC AAT ATC ACC TAC CTT ATC GTA GAT GGC AAT AAC ATG 768 

Lys Phe Phe Asn Asn lie Thr Tyr Leu lie Val Asp Gly Asn Asn Met 
560 565 570 575 

ATC GCT TCT ACA GGG AAA AGG ATA CTC TCA GTA GTG AGC GGT CAA GAG 816 
lie Ala Ser Thr Gly Lys Arg lie Leu Ser Val Val Ser Gly Gin Glu 
580 585 590 

TTC AAC TAT GAT GGG GAT ATT GTG GAT TTG CTT TAT GAT AAG GGG ACT 864 
Phe Asn Tyr Asp Gly Asp lie Val Asp Leu Leu Tyr Asp Lys Gly Thr 
595 600 605 

TTA TAT GTG CTC ACG CTA GAC GGG CAG ATT TTG CAA ATG GAT AAG AGT 912 
Leu Tyr Val Leu Thr Leu Asp Gly Gin lie Leu Gin Met Asp Lys Ser 
610 615 620 

TTG AGG GAA TTA AAC AGC GTG AAA CTG CCT TCG TCG CTC AAC ACG ATT 960 
Leu Arg Glu Leu Asn Ser Val Lys Leu Pro Ser Ser Leu Asn Thr lie 
625 630 635 

GTA TTA AAC CAT AAT AAA TTG TAT TCT TTA GAA AAA CGA GGG TAT GTG 1008 
Val Leu Asn His Asn Lys Leu Tyr Ser Leu Glu Lys Arg Gly Tyr Val 
640 645 650 655 

ATA GAG GTG GAT TTA AAT GAT TTT GAT TCG TAT AAT GTC TAT AAA ACG 1056 
lie Glu Val Asp Leu Asn Asp Phe Asp Ser Tyr Asn Val Tyr Lys Thr 
660 665 670 

CCA ACT ATA GGC AGT TTT AAG TTT TTT TCA TCT AAT CGT TTG GAT AAA 1104 
Pro Thr lie Gly Ser Phe Lys Phe Phe Ser Ser Asn Arg Leu Asp Lys 
675 680 685 

GGG GTG TTT TAT GAT AAA AAT CGG GTG TAT TAC GAT CGC TAC TAT TTA 1152 
Gly Val Phe Tyr Asp Lys Asn Arg Val Tyr Tyr Asp Arg Tyr Tyr Leu 
690 695 700 

GAT TAT AAC GAT TTT AAA CCA AAA CTT TAT CCC GTT GTG GAA AAA TCG 1200 
Asp Tyr Asn Asp Phe Lys Pro Lys Leu Tyr Pro Val Val Glu Lys Ser 
705 710 715 

GCA TCT AAA AAA TCT CAA AAA GGC GAA AAA GGG AAC GCT CCT ATT TAT 1248 
Ala Ser Lys Lys Ser Gin Lys Gly Glu Lys Gly Asn Ala Pro lie Tyr 
720 725 730 735 

TTG CAA GAA AGG CAT AAA GCT AAA GAA AAT AAA CAG CCT TTA GAA GAA 1296 
Leu Gin Glu Arg His Lys Ala Lys Glu Asn Lys Gin Pro Leu Glu Glu 
740 745 750 

AAC AAA GTT AAA CCA AGA AAT AGC GGG TTT GAA GAA GAA GAG GTT AAA 1344 
Asn Lys Val Lys Pro Arg Asn Ser Gly Phe Glu Glu Glu Glu Val Lys 
755 760 765 

ACC AGA AGG CCT GAG CCT ATT AGG GAT CAA AAT AAC GCC ACC CAA CAA 1392 
Thr Arg Arg Pro Glu Pro lie Arg Asp Gin Asn Asn Ala Thr Gin Gin 
770 775 780 

GGC GAA ACA AAA AAC AAT GAA AGT AAA AAC GCT CCT GTC TTA AAA GAA 1440 
Gly Glu Thr Lys Asn Asn Glu Ser Lys Asn Ala Pro Val Leu Lys Glu 
785 790 795 

AAC GCC GCT AAA AAA GAA GTG CCA AAA CCA AAT TCT AAA GAA GAA AAA 1488 
Asn Ala Ala Lys Lys Glu Val Pro Lys Pro Asn Ser Lys Glu Glu Lys 
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800 805 810 815 

CGC CGC TTG AAA GAA GAA AAG AAA AAA GCC AAA GCC GAA CAA AGA GCG 1536 
Arg Arg Leu Lys Glu Glu Lys Lys Lys Ala Lys Ala Glu Gin Arg Ala 
820 825 830 

AGA GAA TIT GAA CAA AGA GCG AGA GAG CAT CAA GAA AGA GAT GAA AAA 1584 
Arg Glu Phe Glu Gin Arg Ala Arg Glu His Gin Glu Arg Asp Glu Lys 
835 840 845 

GAG CTT GAA GAA AGA AGA AAA GCT TTA GAA ATG AAT AAG AAG TAG 1629 
Glu Leu Glu Glu Arg Arg Lys Ala Leu Glu Met Asn Lys Lys * 
850 855 860 



(2) ANGABEN ZU SEQ ID NO: 16: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE : 543 Aminosauren 

( B ) ART : Ami-no s aure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 16: 

Met Asn Lys Pro Phe Leu lie Leu Leu lie Ala Leu He Val Phe Ser 
15 10 15 

Gly Cys Asn Met Arg Lys Tyr Phe Lys Pro Ala Lys His Gin He Lys 
20 25 30 

Gly Glu Ala Tyr Phe Pro Asn His Leu Gin Glu Ser He Val Ser Ser 
35 40 45 

Asn Arg Tyr Gly Ala He Leu Lys Asn Gly Ala Val He Gly Asp Lys 
50 55 60 

Gly Leu Thr Gin Leu Arg He Gly Lys Asn Phe Asn Tyr Glu Ser Ser 
65 70 75 80 

Phe Leu Asn Glu Ser Gin Gly Phe Phe He Leu Ala Gin Asp Cys Leu 
85 90 95 

Asn Lys He Asp Lys Lys Thr Asn Lys Ser Lys Val Ala Lys Thr Glu 
100 105 110 

Glu Thr Glu Leu Lys Leu Lys Gly Val Glu Ala Glu Val Gin Asp Lys 
115 120 125 

Val Cys His Gin Val Glu Leu He Ser Asn Asn Pro Asn Ala Ser Gin 
130 135 140 

Gin Ser He Val He Pro Leu Glu Thr Phe Ala Leu Ser Ala Ser Val 
145 150 155 160 

Lys Gly Asn Leu Leu Ala Val Val Leu Ala Asp Asn Ser Ala Asn Leu 
165 170 175 

Tyr Asp He Thr Ser Gin Lys Leu Leu Phe Ser Glu Lys Gly Ser Pro 
180 185 190 

Ser Thr Thr He Asn Ser Leu Met Ala Met Pro He Phe Met Asp Thr 
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195 200 205 

Val Val Val Phe Pro Met Leu Asp Gly Arg Leu Leu Val Val Asp Tyr 
210 215 220 

Val His Gly Asn Pro Thr Pro lie Arg Asn lie Val lie Ser Ser Asp 
225 230 235 240 

Lys Phe Phe Asn Asn lie Thr Tyr Leu lie Val Asp Gly Asn Asn Met 
245 250 255 

lie Ala Ser Thr Gly Lys Arg lie Leu Ser Val Val Ser Gly Gin Glu 
260 265 270 

Phe Asn Tyr Asp Gly Asp lie Val Asp Leu Leu Tyr Asp Lys Gly Thr 
275 280 285 

Leu Tyr Val Leu Thr Leu Asp Gly Gin lie Leu Gin Met Asp Lys Ser 
290 295 300 

Leu Arg Glu Leu Ash Ser Val Lys Leu Pro Ser Ser Leu Asn Thr lie 
305 310 315 320 

Val Leu Asn His Asn Lys Leu Tyr Ser Leu Glu Lys Arg Gly Tyr Val 
325 330 335 

lie Glu Val Asp Leu Asn Asp Phe Asp Ser Tyr Asn Val Tyr Lys Thr 
340 345 350 

Pro Thr lie Gly Ser Phe Lys Phe Phe Ser Ser Asn Arg Leu Asp Lys 
355 360 365 

Gly Val Phe Tyr Asp Lys Asn Arg Val Tyr Tyr Asp Arg Tyr Tyr Leu 
370 375 380 

Asp Tyr Asn Asp Phe Lys Pro Lys Leu Tyr Pro Val Val Glu Lys Ser 
385 390 395 400 

Ala Ser Lys Lys Ser Gin Lys Gly Glu Lys Gly Asn Ala Pro lie Tyr 
405 410 415 

Leu Gin Glu Arg His Lys Ala Lys Glu Asn Lys Gin Pro Leu Glu Glu 
420 425 430 

Asn Lys Val Lys Pro Arg Asn Ser Gly Phe Glu Glu Glu Glu Val Lys 
435 440 445 

Thr Arg Arg Pro Glu Pro lie Arg Asp Gin Asn Asn Ala Thr Gin Gin 
450 455 460 

Gly Glu Thr Lys Asn Asn Glu Ser Lys Asn Ala Pro Val Leu Lys Glu 
465 470 475 480 

Asn Ala Ala Lys Lys Glu Val Pro Lys Pro Asn Ser Lys Glu Glu Lys 
485 490 495 

Arg Arg Leu Lys Glu Glu Lys Lys Lys Ala Lys Ala Glu Gin Arg Ala 
500 505 510 

Arg Glu Phe Glu Gin Arg Ala Arg Glu His Gin Glu Arg Asp Glu Lys 
515 520 525 
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Glu Leu Glu Glu Arg Arg Lys Ala Leu Glu Met Asn Lys Lys * 
530 535 540 . 

(2) ANGABEN ZU SEQ ID NO: 17: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE : 1377 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM : beides 

(D) TOPOLOGIE: linear 



(vii) UNM I TTELB ARE HERKUNFT: 
(B) CLON(E) : HPS066 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE:1..1377 



(xi) SEQUENZBESCHREIBUNG : SEQ ID NO: 17: 

ATG CTT GAA ACT TCT AGC CAT TTT TTA AAA TCG TTT CGC TTG AAG CGT 48 
Met Leu Glu Thr Ser Ser His Phe Leu Lys Ser Phe Arg Leu Lys Arg 
545 550 555 

TAT ATA GGG TTT TTA TTG ATT TCT TTA GCG TTA TTA ATC ACG CCC TTT 96 
Tyr He Gly Phe Leu Leu He Ser Leu Ala Leu Leu He Thr Pro Phe 
560 565 570 575 

GTT CGC ATT GAT GGG GCG CAT TTG TTT TTG ATC TCT TTT GAG CAT AAG 144 
Val Arg He Asp Gly Ala His Leu Phe Leu He Ser Phe Glu His Lys 
580 585 590 

CAA CTG CAT TTT TTA GGC AAG ATC TTT AGC GCT GAA GAA TTG CAA GTC 192 
Gin Leu His Phe Leu Gly Lys He Phe Ser Ala Glu Glu Leu Gin Val 
595 600 605 

ATG CCT TTT ATG GTT ATT TTG CTT TTT ATA GGG ATT TTT TTC ATC ACC 240 
Met Pro Phe Met Val He Leu Leu Phe He Gly He Phe Phe He Thr 
610 615 620 

ACT AGC CTT GGG CGT GTG TGG TGC GGT TGG GCT TGC CCG CAA ACC TTT 288 
Thr Ser Leu Gly Arg Val Trp Cys Gly Trp Ala Cys Pro Gin Thr Phe 
625 630 635 

TTA AGG GTG CTT TAT AGA GAT GTG ATT GAA ACC AAG ATT TTC AAA CTC 336 
Leu Arg Val Leu Tyr Arg Asp Val He Glu Thr Lys He Phe Lys Leu 
640 645 650 655 

CAT AAA AAG ATC AGC AAC AAG CAA GAA AGC CCT AAA AAC ACC CCA AGC 384 
His Lys Lys He Ser Asn Lys Gin Glu Ser Pro Lys Asn Thr Pro Ser 
660 665 670 

TAC AAG ATC CGT AAA GTA TTG AGC GTT TTA TTG TTC GCT CCT GTT GTG 432 
Tyr Lys He Arg Lys Val Leu Ser Val Leu Leu Phe Ala Pro Val Val 
675 680 685 

GCG GGG CTA ATG ATG TTG TTT TTC TTT TAT TTC ATC GCC CCA GAA GAT 480 
Ala Gly Leu Met Met Leu Phe Phe Phe Tyr Phe He Ala Pro Glu Asp 
690 695 700 
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TTT TTT ATG TAT CTT AAA AAC CCT AGC GAT CAC CCT ATT GCT ATG GGT 528 
Phe Phe Met Tyr Leu Lys Asn Pro Ser Asp His Pro lie Ala Met Gly 
705 710 715 

TTT TGG CTT TTT AGC ACG GCT GTG GTG CTA TTT GAT ATA GTG GTG GTT 576 
Phe Trp Leu Phe Ser Thr Ala Val Val Leu Phe Asp He Val Val Val 
720 725 730 735 

GCG GAG CGT TTT TGC ATT TAT TTA TGC CCT TAC GCT AGG GTG CAA TCG 624 
Ala Glu Arg Phe Cys He Tyr Leu Cys Pro Tyr Ala Arg Val Gin Ser 
740 745 750 

GTG TTG TAT GAC AAT GAC ACC TTA AAC CCT ATT TAT GAT GAA AAG CGC 672 
Val Leu Tyr Asp Asn Asp Thr Leu Asn Pro He Tyr Asp Glu Lys Arg 
755 760 765 

GGC GGA GCG CTT TAT AAT AAT CAG GGC CAT CTC TTC CCC TTA CCT CCC 720 
Gly Gly Ala Leu Tyr Asn Asn Gin Gly His Leu Phe Pro Leu Pro Pro 
770 775 780 

AAA AAA CGC AGC CCA GAA AAC GAA TGC GTG AAT TGT TTG CAT TGC GTG 768 
Lvs Lys Arg Ser Pro Glu Asn Glu Cys Val Asn Cys Leu His Cys Val 
785 790 795 

CAG GTT TGC CCC ACG CAT ATT GAC ATC AGG AAG GGC TTG CAA TTA GAA 816 
Gin Val Cys Pro Thr His He Asp He Arg Lys Gly Leu Gin Leu Glu 
800 805 810 815 

TGC ATC AAT TGT TTA GAA TGC GTG GAT GCA TGC ACG ATT ACC ATG GCT 864 
Cys He Asn Cys Leu Glu Cys Val Asp Ala Cys Thr He Thr Met Ala 
820 825 830 

AAA TTT AAC CGC CCT TCA CTC ATC CAA TGG TCT TCA ACT AAC GCT ATT 912 
Lys Phe Asn Arg Pro . Ser Leu He Gin Trp Ser Ser Thr Asn Ala He 
835 840 845 

AAT ACG CGC CAA AAA GTG CAC CTG GTG CGT TTA AAA ACG ATC GCT TAC 960 
Asn Thr Arg Gin Lys Val His Leu Val Arg Leu Lys Thr He Ala Tyr 
850 855 860 

ATG GGG GTT ATC GCT ATT GTG ATC GCT CTT TTA GCC ATC ACT TCG TTT 1008 
Met Gly Val He Ala He Val He Ala Leu Leu Ala He Thr Ser Phe 
865 870 875 

AAA AAA GAA CGC ATG CTC TTA GAC ATT AAC CGC AAC AGC GAT CTG TAT 1056 
Lys Lys Glu Arg Met Leu Leu Asp He Asn Arg Asn Ser Asp Leu Tyr 
880 885 890 895 

GAA TTG CGC TCT AGC GGG TAT GTG GAT AAC GAT TAC GTG TTT TTA TTC 1104 
Glu Leu Arg Ser Ser Gly Tyr Val Asp Asn Asp Tyr Val Phe Leu Phe 
900 905 910 

CAC AAC ACG GAC AAT AAA GAC CAT GAG TTT TAT TTC AAA GTT TTA GGG 1152 
His Asn Thr Asp Asn Lys Asp His Glu Phe Tyr Phe Lys Val Leu Gly 
915 920 925 

CAA AAA GAC ATT CAG ATC AAA AAG CCT TTA AAT CCT ATC GCC ATT AAA 1200 
Gin Lys Asp He Gin He Lys Lys Pro Leu Asn Pro He Ala He Lys 
930 935 940 

GCC GGG CAA AAG ATT AAA GCG GTA GTG ATT TTA AGA AAA CCC CTA AAG 1248 
Ala Gly Gin Lys He Lys Ala Val Val He Leu Arg Lys Pro Leu Lys 
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945 950 955 

AGT AAC GCC ACA GAA TAC AAG AAC GCT AAA GAC GCT CTA ATC CCC ATT 1296 
Ser Asn Ala Thr Glu Tyr Lys Asn Ala Lys Asp Ala Leu lie Pro lie 
960 965 970 975 

ACC ATA CAA GCT TAT AGC GCG GAC GAT AAG AAT ATT ACG ATA GAA AGG 1344 
Thr lie Gin Ala Tyr Ser Ala Asp Asp Lys Asn He Thr He Glu Arg 
980 985 990 

GAA TCG GTG TTT ATT GCA CCA AGT GAG GAT TGA 1377 
Glu Ser Val Phe He Ala Pro Ser Glu Asp * 
995 1000 



(2) ANGABEN ZU SEQ ID NO: 18: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 459 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 18: 

Met Leu Glu Thr Ser Ser His Phe Leu Lys Ser Phe Arg Leu Lys Arg 

5 10 15 



1 



TVr He Gly Phe Leu Leu He Ser Leu Ala Leu Leu He Thr Pro Phe 
20 25 30 

Val Arg He Asp Gly Ala His Leu Phe Leu He Ser Phe Glu His Lys 
35 40 45 

Gin Leu His Phe Leu Gly Lys He Phe Ser Ala Glu Glu Leu Gin Val 
50 55 60 

Met Pro Phe Met Val He Leu Leu Phe He Gly He Phe Phe He Thr 
65 70 75 80 

Thr Ser Leu Gly Arg Val Trp Cys Oly Trp Ala Cys Pro Gin Thr Phe 
85 90 95 

Leu Arg Val Leu Tyr Arg Asp Val He Glu Thr Lys He Phe Lys Leu 
100 105 110 

His Lys Lys He Ser Asn Lys Gin Glu Ser Pro Lys Asn Thr Pro Ser 
115 120 125 

Tyr Lys He Arg Lys Val Leu Ser Val Leu Leu Phe Ala Pro Val Val 
130 135 140 

Ala Gly Leu Met Met Leu Phe Phe Phe Tyr Phe He Ala Pro Glu Asp 
145 150 155 160 

Phe Phe Met Tyr Leu Lys Asn Pro Ser Asp His Pro He Ala Met Gly 
165 170 175 

Phe Trp Leu Phe Ser Thr Ala Val Val Leu Phe Asp He Val Val Val 
180 185 190 

Ala Glu Arg Phe Cys He Tyr Leu Cys Pro Tyr Ala Arg Val Gin Ser 
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200 



205 



Val Leu Tyr Asp Asn Asp Thr Leu Asn Pro lie Tyr Asp 
210 215 220 



Glu Lys Arg 



Gly Gly Ala Leu Tyr Asn Asn Gin Gly His Leu Phe Pro Leu Pro Pro 
225 230 235 240 

Lys Lys Arg Ser Pro Glu Asn Glu Cys Val Asn Cys Leu His Cys Val 
245 250 255 

Gin Val Cys Pro Thr His lie Asp lie Arg Lys Gly Leu Gin Leu Glu 
260 265 270 

Cys lie Asn Cys Leu Glu Cys Val Asp Ala Cys Thr lie Thr Met Ala 
275 280 285 

Lys Phe Asn Arg Pro Ser Leu lie Gin Trp Ser Ser Thr Asn Ala lie 
290 295 300 

Asn Thr Arg Gin Lys Val His Leu Val Arg Leu Lys Thr lie Ala Tyr 
305 310 315 320 

Met Gly Val lie Ala He Val He Ala Leu Leu Ala He Thr Ser Phe 
325 330 335 

Lys Lys Glu Arg Met Leu Leu Asp He Asn Arg Asn Ser Asp Leu Tyr 
340 345 350 

Glu Leu Arg Ser Ser Gly Tyr Val Asp Asn Asp Tyr Val Phe Leu Phe 
355 360 365 

His Asn Thr Asp Asn Lys Asp His Glu Phe Tyr Phe Lys Val Leu Gly 
370 375 380 

Gin Lys Asp He Gin He Lys Lys Pro Leu Asn Pro He Ala He Lys 
385 390 395 400 

Ala Gly Gin Lys He Lys Ala Val Val He Leu Arg Lys Pro Leu Lys 
405 410 415 

Ser Asn Ala Thr Glu Tyr Lys Asn Ala Lys Asp Ala Leu He Pro He 
420 425 430 

Thr He Gin Ala Tyr Ser Ala Asp Asp Lys Asn He Thr He Glu Arg 
435 440 445 

Glu Ser Val Phe He Ala Pro Ser Glu Asp * 
450 455 

(2) ANGABEN ZU SEQ ID NO: 19: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 1533 Basenpaare 
<B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKCNFT: 
(B) CLON(E) : HPS068 
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(ix) MERKMAL: 

(A) NAME/ SCHLUSSEL : CDS 

(B) LAGE:1..1533 



(xi) SEQUENZBESCHREIBUNG : SEQ ID NO: 19: 

ATG AAA AAA ACA ACC CTC TTT GTA TTG GGC TTA TTA TTT AAT AGC TTT 48 
Met Lys Lys Thr Thr Leu Phe Val Leu Gly Leu Leu Phe Asn Ser Phe 
460 465 470 475 

TTA AAT GCT GTT GAT GGG ATT TCT AAA ACC GAT CTT TCT TCT TTG AAT 96 
Leu Asn Ala Val Asp Gly lie Ser Lys Thr Asp Leu Ser Ser Leu Asn 
480 485 490 

TTG GCT GAA GAC AGC GCG CCT TTG AAC CAT CCT AAC GCT CAA AAA CTC 144 
Leu Ala Glu Asp Ser Ala Pro Leu Asn His Pro Asn Ala Gin Lys Leu 
495 500 505 

TCC TTA AAA AAC GCA TGG ACT AGG GTA TTG TCT AAC CAT GAA GGC TTG 192 
Ser Leu Lys Asn Ala Trp Thr Arg Val Leu Ser Asn His Glu Gly Leu 
510 515 520 

CAT GCG CAA GAA TAC GCC ATT AAG CGA GCG AGT AAA ATG AAA TTA GCG 240 
His Ala Gin Glu Tyr Ala lie Lys Arg Ala Ser Lys Met Lys Leu Ala 
525 530 535 

GCT AAA CTT TCT TTT TTG CCT CAA ATT GAT TTG AGC GCT TTT TAT GTG 288 
Ala Lys Leu Ser Phe Leu Pro Gin lie Asp Leu Ser Ala Phe Tyr Val 
540 545 550 555 

TAT CTC TCT AAC CCC ATT AAA ATG GAT TTT GCC AGC CAA AAA CAA CCG 336 
Tyr Leu Ser Asn Pro lie Lys Met Asp Phe Ala Ser Gin Lys Gin Pro 
560 565 570 

GGC GTG CAA AAA GCC ACC AAC CAG ATC CAT CAA GGC ATA CAA AAC ATC 384 
Gly Val Gin Lys Ala Thr Asn Gin lie His Gin Gly lie Gin Asn lie 
575 580 585 

CAG CAA AAT ATC CCT TCT CAA GTA TTA ACC CCT CAA ATC CAA GCG GGC 432 
Gin Gin Asn lie Pro Ser Gin Val Leu Thr Pro Gin lie Gin Ala Gly 
590 595 600 

ATG CAA GGG GTG ATG CAA GGT TTT GGG GCT TTG AGC AGC ACT TTA GAA 480 
Met Gin Gly Val Met Gin Gly Phe Gly Ala Leu Ser Ser Thr Leu Glu 
605 610 615 

GCC CCC TTA TTG TTT TCT AAG CAA AAT GTG GTG ATT GGG GCT TTG AGC 528 
Ala Pro Leu Leu Phe Ser Lys Gin Asn Val Val lie Gly Ala Leu Ser 
620 625 630 635 

ATT ATT TAT CCC CTT TAT ATG GGT GGG GCA AGA TTC ACG ATG GTG CGC 576 
lie lie Tyr Pro Leu Tyr Met Gly Gly Ala Arg Phe Thr Met Val Arg 
640 645 650 

ATT GCG GAT TTG ATG CAA AAA GAT GCT AAT GAA GTG TAT CGT TTG AAA 624 
lie Ala Asp Leu Met Gin Lys Asp Ala Asn Glu Val Tyr Arg Leu Lys 
655 660 665 

AAG CTT TCC ACT TTT CAA GAG CTT GTG AGC GTG TAT TAC GGC ATG GTG 672 
Lys Leu Ser Thr Phe Gin Glu Leu Val Ser Val Tyr Tyr Gly Met Val 
670 675 680 
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TTA AAC GCA GAA GTG GCT GAA ACT TTA GAA GAG GTG GAA AAA GGC CAT 720 
Leu Asn Ala Glu Val Ala Glu Thr Leu Glu Glu Val Glu Lys Gly His 
685 690 695 * 

TAT AAG CAT TTC CAA AAC GCT TTG AAA ATG CAA AAA GTG GGG CAA ATC 768 
Tyr Lys His Phe Gin Asn Ala Leu Lys Met Gin Lys Val Gly Gin lie 
700 705 710 715 

GCT AGG GTA GAA ACC TTA GGC GCT CAA GTG GCT TAT GAT AAG GCC CAT 816 
Ala Arg Val Glu Thr Leu Gly Ala Gin Val Ala Tyr Asp Lys Ala His 
720 725 730 

ATC GCT AGC GTT AAG GCT AAA GAC GTG TTA GAA GTT TCG CAG CTC TCG 864 
lie Ala Ser Val Lys Ala Lys Asp Val Leu Glu Val Ser Gin Leu Ser 
735 740 745 

TTC AAT TCC ATT TTA TCT AGC AAG GAC GAT TTA GTG CCT TCA AGC AAA 912 
Phe Asn Ser lie Leu Ser Ser Lys Asp Asp Leu Val Pro Ser Ser Lys 
750 755 760 

TTA GAG ATC CGC ACG GAG AAA AAT CTG CCC GAT CTG AGC TTT TTT GTT 960 
Leu Glu lie Arg Thr Glu Lys Asn Leu Pro Asp Leu Ser Phe Phe Val 
765 770 775 

TCT TCC ACG CTC AAT TCC TAC CCG GTT TTA AAG ACT TTA GAA AAT CAG 1008 
Ser Ser Thr Leu Asn Ser Tyr Pro Val Leu Lys Thr Leu Glu Asn Gin 
780 785 790 795 

ATT CAA ATC TCT AAA GAA AAC ACG AAA TTA CAG ATC GCT AAA TTC TTG 1056 
lie Gin He Ser Lys Glu Asn Thr Lys Leu Gin He Ala Lys Phe Leu 
800 805 810 

CCC CAA GTG AGT TTT TTT GGC TCT TAT ATT ATG AAG CAA AAC AAT TCG 1104 
Pro Gin Val Ser Phe Phe Gly Ser Tyr He Met Lys Gin Asn Asn Ser 
815 820 825 

GTG TTT GAA GAC ATG ATC CCT AGT TGG TTT GTG GGC GTG GCC GGG CGC 1152 
Val Phe Glu Asp Met He Pro Ser Trp Phe Val Gly Val Ala Gly Arg 
830 835 840 

ATG CCT ATT CTT TCT CCC ACA GGG CGC ATT CAA AAA TAC CAA GCG AGC 1200 
Met Pro He Leu Ser Pro Thr Gly Arg He Gin Lys Tyr Gin Ala Ser 
845 850 855 

AAA TTA—GCG GAG TTG CAA GTG AGT AGC GAA CAA ATC CAG GCT AAA AAA 1248 
Lys Leu Ala Glu Leu Gin Val Ser Ser Glu Gin He Gin Ala Lys Lys 
860 865 870 875 

AAC ATG GAA TTA TTA GTG AAT AAG ACT TAT AAA GAG ACG CTT TCT TAT 1296 
Asn Met Glu Leu Leu Val Asn Lys Thr Tyr Lys Glu Thr Leu Ser Tyr 
880 885 890 

TTG AAA GAA TAC AAA AGC TTG CTT TCT AGC GTG GAA TTA GCC AAG GAA 1344 
Leu Lys Glu Tyr Lys Ser Leu Leu Ser Ser Val Glu Leu Ala Lys Glu 
895 900 905 

AAC TTA AAA CTC CAA GAG CAG GCT TTT TTA CAA GGC TTA AGC ACG AAC 1392 
Asn Leu Lys Leu Gin Glu Gin Ala Phe Leu Gin Gly Leu Ser Thr Asn 
910 915 920 

GCT CAA GTC ATT GAT GCG AGG AAC ACG CTT TCT TCT ATC GTC GTG GAG 1440 
Ala Gin Val He Asp Ala Arg Asn Thr Leu Ser Ser He Val Val Glu 
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925 930 935 

CAA AAA AGC GTG GCT TAT AAA TAC ATC GTT TCA TTA GCG AAT TTA ATG 1488 
Gin Lys Ser Val Ala Tyr Lys Tyr lie Val Ser Leu Ala Asn Leu Met 
940 945 950 955 

GCG TTA AGC GAT CAT ATT GAT TTA TTT TAT GAA TTT GTT TAT TAA 1533 
Ala Leu Ser Asp His lie Asp Leu Phe Tyr Glu Phe Val Tyr * 
960 965 970 



(2) ANGABEN ZU SEQ ID NO: 20: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE : 511 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 20: 

Met Lys Lys Thr Thr Leu Phe Val Leu Gly Leu Leu Phe Asn Ser Phe 
15 10 15 

Leu Asn Ala Val Asp Gly lie Ser Lys Thr Asp Leu Ser Ser Leu Asn 
20 25 30 

Leu Ala Glu Asp Ser Ala Pro Leu Asn His Pro Asn Ala Gin Lys Leu 
35 40 45 

Ser Leu Lys Asn Ala Trp Thr Arg Val Leu Ser Asn His Glu Gly Leu 
50 55 60 

His Ala Gin Glu Tyr Ala lie Lys Arg Ala Ser Lys Met Lys Leu Ala 
65 70 75 80 

Ala Lys Leu Ser Phe Leu Pro Gin lie Asp Leu Ser Ala Phe Tyr Val 

85 90 95 

Tyr Leu Ser Asn Pro lie Lys Met Asp Phe Ala Ser Gin Lys Gin Pro 
100 105 110 

Gly Val Gin Lys Ala Thr Asn Gin lie His Gin Gly He Gin Asn He 
115 120 125 

Gin Gin Asn He Pro Ser Gin Val Leu Thr Pro Gin He Gin Ala Gly 
130 135 140 

Met Gin Gly Val Met Gin Gly Phe Gly Ala Leu Ser Ser Thr Leu Glu 
145 150 155 160 

Ala Pro Leu Leu Phe Ser Lys Gin Asn Val Val He Gly Ala Leu Ser 
165 170 175 

He He Tyr Pro Leu Tyr Met Gly Gly Ala Arg Phe Thr Met Val Arg 
180 185 190 

He Ala Asp Leu Met Gin Lys Asp Ala Asn Glu Val Tyr Arg Leu Lys 
195 200 205 

Lys Leu Ser Thr Phe Gin Glu Leu Val Ser Val Tyr Tyr Gly Met Val 
210 215 220 
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Leu Asn Ala Glu Val Ala Glu Thr Leu Glu Glu Val Glu Lys Gly His 
225 230 235 240 

Tyr Lys His Phe Gin Asn Ala Leu Lys Met Gin Lys Val Gly Gin lie 
245 250 255 

Ala Arg Val Glu Thr Leu Gly Ala Gin Val Ala Tyr Asp Lys Ala His 
260 265 270 

lie Ala Ser Val Lys Ala Lys Asp Val Leu Glu Val Ser Gin Leu Ser 
275 280 285 

Phe Asn Ser He Leu Ser Ser Lys Asp Asp Leu Val Pro Ser Ser Lys 
290 295 300 

Leu Glu He Arg Thr Glu Lys Asn Leu Pro Asp Leu Ser Phe Phe Val 
305 310 315 320 

Ser Ser Thr Leu Asn Ser Tyr Pro Val Leu Lys Thr Leu Glu Asn Gin 
325 330 335 

He Gin He Ser Lys Glu Asn Thr Lys Leu Gin He Ala Lys Phe Leu 
340 345 350 

Pro Gin Val Ser Phe Phe Gly Ser Tyr He Met Lys Gin Asn Asn Ser 
355 360 365 

Val Phe Glu Asp Met He Pro Ser Trp Phe Val Gly Val Ala Gly Arg 
370 375 380 

Met Pro He Leu Ser Pro Thr Gly Arg He Gin Lys Tyr Gin Ala Ser 
385 390 395 400 

Lys Leu Ala Glu Leu Gin Val Ser Ser Glu Gin He Gin Ala Lys Lys 
405 410 415 

Asn Met Glu Leu Leu Val Asn Lys Thr Tyr Lys Glu Thr Leu Ser Tyr 
420 425 430 

Leu Lys Glu Tyr Lys Ser Leu Leu Ser Ser Val Glu Leu Ala Lys Glu 
435 440 445 

Asn Leu Lys Leu Gin Glu Gin Ala Phe Leu Gin Gly Leu Ser Thr Asn 
450 455 460 

Ala Gin Val He Asp Ala Arg Asn Thr Leu Ser Ser He Val Val Glu 
465 470 475 480 

Gin Lys Ser Val Ala Tyr Lys Tyr He Val Ser Leu Ala Asn Leu Met 
485 490 495 

Ala Leu Ser Asp His He Asp Leu Phe Tyr Glu Phe Val Tyr * 
500 505 510 

(2) ANGABEN ZU SEQ ID NO: 21: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 957 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 
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(vii) UNMITTELBARE HERKUNFT: 
(B) CLON(E) : HPS074 

(ix) MERKMAL: 

(A) NAME/ SCHLUSSEL : CDS 

(B) LAGE:1..957 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 21: 

ATG TTA AGT AGA GAC ATT GTC CAA TAT TCC AAG ATC CGC ACC GAG TTA 48 
Met Leu Ser Arg Asp He Val Gin Tyr Ser Lys He Arg Thr Glu Leu 
515 520 525 

TAC GCT TAT CTT ACC TAT TTG TTT TCG CAC AAT ATC CGC AAC CAC CTC 96 
TVr Ala Tyr Leu Thr Tyr Leu Phe Ser His Asn lie Arg Asn His Leu 
530 535 540 

CCT GAA ATC ACT TTG GAT TAT TTA AAC AAA CAG ATC AGA AAA ATG CAC 144 
Pro Glu He Thr Leu Asp Tyr Leu Asn Lys Gin He Arg Lys Met His 
545 550 555 

GCT GAA ATC AAA ATG GCA AAA AAT TTT TTT GTG TTA GAC GCT AAG GGC 192 
Ala Glu He Lys Met Ala Lys Asn Phe Phe Val Leu Asp Ala Lys Gly 
560 565 570 575 

ATG CTA ATT CTT AAG CCA AGC CAG CTT AAA GAG CAG GGG CAT AAG GAA 240 
Met Leu He Leu Lys Pro Ser Gin Leu Lys Glu Gin Gly His Lys Glu 
580 585 590 

GGG ATA TTA GAG CAT GAT TTA ACA GAA GGG ATT GAA CTA GAA TCG CAT 288 
Gly He Leu Glu His Asp Leu Thr Glu Gly He Glu Leu Glu Ser His 
595 600 605 

GCC AGT TTT AGC GAT AAG TAT TAT TTT TAT CAA GCC GTG AGC GAA AAG 336 
Ala Ser Phe Ser Asp Lys Tyr Tyr Phe Tyr Gin Ala Val Ser Glu Lys 
610 615 620 

CGT TGC ATT TTA ACG GAC CCC TAT CCT TCT AAA AAA GGA AAC CAT TTA 384 
Arg Cys He Leu Thr Asp Pro Tyr Pro Ser Lys Lys Gly Asn His Leu 
625 630 635 

GTA GTG AGC GCG TCT TAC CCG GTG TAT GAT CAA AAT AAC GAT CTA GCG 432 
Val Val Ser Ala Ser Tyr Pro Val Tyr Asp Gin Asn Asn Asp Leu Ala 
640 645 650 655 

TTT GTG GTG TGC TTG CAA ATC CCT TTG AGG GTA GCG ATT GAA ATC AGC 480 
Phe Val Val Cys Leu Gin He Pro Leu Arg Val Ala He Glu He Ser 
660 665 670 

TCG CCT TCA AAG TAT TTC AGA ACC TTT AGC GAA GGG AGC ATG GTT ATG 528 
Ser Pro Ser Lys Tyr Phe Arg Thr Phe Ser Glu Gly Ser Met Val Met 
675 680 685 

TAT TTT ATG ATT TCT ATC ATG CTC ACT TTA GTG TCG TTG CTT TTA TTT 576 
Tyr Phe Met He Ser He Met Leu Thr Leu Val Ser Leu Leu Leu Phe 
690 695 700 

GTG AAA TGC ATT TCT AGC TTT TGG ACA GCG ATT GTT AAT TTT AGC AGT 624 
Val Lys Cys He Ser Ser Phe Trp Thr Ala He Val Asn Phe Ser Ser 
705 710 715 
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TTT GAC ATT AAA GAA GTG TTC CAC CCC ATT GTG CTT TTA ACC CTA GCC 672 
Phe Asp lie Lys Glu Val Phe His Pro lie Val Leu Leu Thr Leu Ala 
720 725 730 735 

TTA GCC ACC TTT GAT CTA GTC AAG GCG ATT TTT GAA GAG GAA GTT TTG 720 
Leu Ala Thr Phe Asp Leu Val Lys Ala lie Phe Glu Glu Glu Val Leu 
740 745 750 

GGT AAA AAT AGC GGG GAC AAC CAC CAT GCG ATC CAC CGC ACG ATG ATC 768 
Gly Lys Asn Ser Gly Asp Asn His His Ala lie His Arg Thr Met lie 
755 760 765 

AGG TTT TTA GGC TCT ATC ATT ATC GCA TTA GCC ATT GAA GCG TTA ATG 816 
Arg Phe Leu Gly Ser lie lie He Ala Leu Ala He Glu Ala Leu Met 
770 775 780 

TTA GTG TTT AAA TTC AGC GTG AGC GAA CCG GAT AAA ATC ACT TAT GCG 864 
Leu Val Phe Lys Phe Ser Val Ser Glu Pro Asp Lys He Thr Tyr Ala 
785 790 795 

GTG TAT TTG GCT GTT GGC GTG GCG GTG CTT TTG ATC AGT TTG GCG ATT 912 
Val Tyr Leu Ala Val Gly Val Ala Val Leu Leu He Ser Leu Ala He 
800 805 810 815 

TAT GTC AAA TTC GCC TAT AGC GTG TTG CCC AAA CGA GAA CGC TAA 957 
Tyr Val Lys Phe Ala Tyr Ser Val Leu Pro Lys Arg Glu Arg * 
820 825 830 



(2) ANGABEN ZU SEQ ID NO: 22: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 319 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 22: 

Met Leu Ser Arg Asp He Val Gin Tyr Ser Lys He Arg Thr Glu Leu 
15 10 15 

Tyr Ala Tyr Leu Thr Tyr Leu Phe Ser His Asn He Arg Asn His Leu 
20 25 30 

Pro Glu He Thr Leu Asp Tyr Leu Asn Lys Gin He Arg Lys Met His 
35 40 45 

Ala Glu He Lys Met Ala Lys Asn Phe Phe Val Leu Asp Ala Lys Gly 
50 55 60 

Met Leu He Leu Lys Pro Ser Gin Leu Lys Glu Gin Gly His Lys Glu 
65 70 75 80 

Gly He Leu Glu His Asp Leu Thr Glu Gly He Glu Leu Glu Ser His 
85 90 95 

Ala Ser Phe Ser Asp Lys Tyr Tyr Phe Tyr Gin Ala Val Ser Glu Lys 
100 105 110 

Arg Cys He Leu Thr Asp Pro Tyr Pro Ser Lys Lys Gly Asn His Leu 
115 120 125 
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Val Val Ser Ala Ser Tyr Pro Val Tyr Asp Gin Asn Asn Asp Leu Ala 
130 135 140 

Phe Val Val Cys Leu Gin lie Pro Leu Arg Val Ala lie Glu lie Ser 
145 150 155 160 

Ser Pro Ser Lys Tyr Phe Arg Thr Phe Ser Glu Gly Ser Met Val Met 
165 170 175 

Tyr Phe Met lie Ser He Met Leu Thr Leu Val Ser Leu Leu Leu Phe 
180 185 190 

Val Lys Cys He Ser Ser Phe Trp Thr Ala He Val Asn Phe Ser Ser 
195 200 205 

Phe Asp He Lys Glu Val Phe His Pro He Val Leu Leu Thr Leu Ala 
210 215 220 

Leu Ala Thr Phe Asp Leu Val Lys Ala He Phe Glu Glu Glu Val Leu 
225 230 235 240 

Gly Lys Asn Ser Gly Asp Asn His His Ala He His Arg Thr Met He 
245 250 255 

Arq Phe Leu Gly Ser He He He Ala Leu Ala He Glu Ala Leu Met 
260 265 270 

Leu Val Phe Lys Phe Ser Val Ser Glu Pro Asp Lys He Thr Tyr Ala 
275 280 285 

Val Tyr Leu Ala Val Gly Val Ala Val Leu Leu He Ser Leu Ala He 
290 295 300 

Tyr Val Lys Phe Ala Tyr Ser Val Leu Pro Lys Arg Glu Arg * 
305 310 315 

(2) ANGABEN ZU SEQ ID NO: 23: 

(i) SEQUENZKENNZEICHEN : 

(A) LANGE: 480 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: be ides 

(D) TOPOLOGIE : linear 



(vii) UNMITTELBARE HERKUNFT : 
<B) CLON(E) : HPS083 

(ix) MERKMAL: 

(A) NAME / S CHLUS S EL : CDS 

(B) LAGE: 1 - -480 

(xi) SEQUENZBESCHREIBUNG : SEQ ID NO: 23: 

ATG CAC TCT CCA AAT TTA GAA AAA GAA GAA ACC GAA ATC ATA GAA ACA 48 
Met His Ser Pro Asn Leu Glu Lys Glu Glu Thr Glu He He Glu Thr 
320 325 330 335 

CTC CTT ATG CGT GAA AAA ATG CGT TTA TGC CCC TTG TAT TGG CGC ATC 96 
Leu Leu Met Arg Glu Lys Met Arg Leu Cys Pro Leu Tyr Trp Arg He 
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340 345 350 

TTA GCG TTT TTA ACC GAT GGT TTG TTA GTG GCG TTT TTA TTG AGC GAT 144 
Leu Ala Phe Leu Thr Asp Gly Leu Leu Val Ala Phe Leu Leu Ser Asp 
355 360 ' 365 

CTT TTA GAC GCA TGC GAT TTC TTG CAT TCT TTA TAT TGG CTA GCT AAC 192 
Leu Leu Asp Ala Cys Asp Phe Leu His Ser Leu Tyr Trp Leu Ala Asn 
370 375 380 

CCT ATT TAT CAC AGC GCA TTT GTT GCG ATG GGT TTT ATC ATC TTG TAT 240 
Pro lie Tyr His Ser Ala Phe Val Ala Met Gly Phe He He Leu Tyr 
385 390 395 

GGC GTT TAT GAA ATC TTT TTT GTG TGT TTG TGC AAG ATG AGC TTG GCT 288 
Gly Val Tyr Glu He Phe Phe Val Cys Leu Cys Lys Met Ser Leu Ala 
400 405 410 415 

AAA CTG GTT TTT AGG ATT AAG ATT ATT GAT ATT TAT TTG GCA GAT TGC 3 36 

Lys Leu Val Phe Arg 11^ Lys He He Asp He Tyr Leu Ala Asp Cys 
420 425 430 

CCC AGT AGG GCT ATT TTA TTG AAG CGT TTA GGG TTA AAG ATC GTG GTT 384 
Pro Ser Arg Ala He Leu Leu Lys Arg Leu Gly Leu Lys He Val Val 
435 440 445 

TTT CTA TGC CCC TTT TTA TGG TTT GTT GCG TTT AAA AAC CCC TAT CAT 432 
Phe Leu Cys Pro Phe Leu Trp Phe Val Ala Phe Lys Asn Pro Tyr His 
450 455 460 

AGG GCG TGG CAT GAA GAA AAA AGC AAA AGT CTT TTG GTA TTG TTT TAA 480 
Arg Ala Trp His Glu Glu Lys Ser Lys Ser Leu Leu Val Leu Phe * 
465 470 475 

(2) ANGABEN ZU SEQ ID NO: 24: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 160 Aminosauren 

( B ) ART : Aminos aure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKOLS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 24: 

Met His Ser Pro Asn Leu Glu Lys Glu Glu Thr Glu He He Glu Thr 
1 5 10 15 

Leu Leu Met Arg Glu Lys Met Arg Leu Cys Pro Leu Tyr Trp Arg He 
20 25 30 

Leu Ala Phe Leu Thr Asp Gly Leu Leu Val Ala Phe Leu Leu Ser Asp 
35 40 45 

Leu Leu Asp Ala Cys Asp Phe Leu His Ser Leu Tyr Trp Leu Ala Asn 
50 55 60 

Pro He Tyr His Ser Ala Phe Val Ala Met Gly Phe He He Leu Tyr 
65 70 75 80 

Gly Val Tyr Glu He Phe Phe Val Cys Leu Cys Lys Met Ser Leu Ala 
85 90 95 
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Lys Leu Val Phe Arg He Lys He He Asp He Tyr Leu Ala Asp Cys 
100 105 HO 

Pro Ser Arg Ala He Leu Leu Lys Arg- Leu Gly Leu Lys He Val Val 
115 120 125 

Phe Leu Cys Pro Phe Leu Trp Phe Val Ala Phe Lys Asn Pro Tyr His 
130 135 140 

Arg Ala Trp His Glu Glu Lys Ser Lys Ser Leu Leu Val Leu Phe * 
145 150 155 160 

(2) ANGABEN ZU SEQ ID NO: 25: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 1983 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT: 
(B) CLON(E) : HPS084 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE:1..1983 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 25: 

ATG ATT TAT TGG TTG TAT TTG GCG GTC TTT TTT TTG TTG AGC GCA TTA 48 
Met He Tyr Trp Leu Tyr Leu Ala Val Phe Phe Leu Leu Ser Ala Leu 
165 170 175 

GAC GCT AAA GAA ATC GCT ATG CAA CGA TTT GAC AAA CAA AAC CAT AAG 96 
Asp Ala Lys Glu He Ala Met Gin, Arg Phe Asp Lys Gin Asn His Lys 
180 185 190 

ATT TTT GAA ATC CTT GCG GAT AAA GTG AGC GCT AAA GAC AAT GTG ATA 144 
He Phe Glu He Leu Ala Asp Lys Val Ser Ala Lys Asp Asn Val He 
195 200 205 

ACC GCA TCA GGG AAT GCG ATC TTA TTG AAT TAT GAT GTG TAT ATT CTA 192 
Thr Ala Ser Gly Asn Ala He Leu Leu Asn Tyr Asp Val Tyr He Leu 
210 "215 220 

GCG GAC AAG GTG CGT TAT GAC ACT AAA ACC AAA GAA GCG TTA TTA GAG 240 
Ala Asp Lys Val Arg Tyr Asp Thr Lys Thr Lys Glu Ala Leu Leu Glu 
225 230 235 240 

GGG AAT ATC AAG GTT TAT AGG GGC GAG GGT TTG CTC GTT AAA ACC GAT 288 
Gly Asn He Lys Val Tyr Arg Gly Glu Gly Leu Leu Val Lys Thr Asp 
245 250 255 

TAC GTG AAA TTG AGT TTG AAT GAA AAA TAT GAA ATC ATT TTC CCC TTT 336 
Tyr Val Lys Leu Ser Leu Asn Glu Lys Tyr Glu He He Phe Pro Phe 
260 265 270 



TAT GTC CAA GAC AGC GTG AGC GGG ATT TGG GTG AGC GCG GAT ATT GCC 



384 
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Tyr Val Gin Asp Ser Val Ser Gly lie Trp Val Ser Ala Asp He Ala 
275 280 285 

AGC GGA AAG GAT CAA AAA TAT AAG GTT AAA AAC ATG AGC ACT TCA GGG 432 
Ser Gly Lys Asp Gin Lys Tyr Lys Val Lys Asn Met Ser Thr Ser Gly 
290 295 300 

TGC AGC ATT GAT AAC CCC ATT TGG CAT GTC AAT GCG ACT TCA GGC TCA 480 
Cys Ser He Asp Asn Pro He Trp His Val Asn Ala Thr Ser Gly Ser 
305 310 315 320 

TTC AAC ATG CAA AAA TCG CAT TTG TCT ATG TGG AAT CCT AAG ATC TAT 528 
Phe Asn Met Gin Lys Ser His Leu Ser Met Trp Asn Pro Lys He Tyr 
325 330 335 

GTC GGT GAT ATT CCT GTA TTG TAT TTG CCC TAT ATT TTC ATG TCC ACG 576 
Val Gly Asp He Pro Val Leu Tyr Leu Pro Tyr He Phe Met Ser Thr 
340 345 350 

AGC AAT AAA AGA ACT ACT GGG TTT TTA TAC CCT GAG TTT GGC ACT TCC 624 
Ser Asn Lys Arg Thr Thr Gly Phe Leu Tyr Pro Glu Phe Gly Thr Ser 
355 360 365 

AAC TTA GAC GGC TTT ATT TAT TTG CAA CCC TTT TAT TTA GCC CCC AAA 672 
Asn Leu Asp Gly Phe He Tyr Leu Gin Pro Phe Tyr Leu Ala Pro Lys 
370 375 380 

AAC TCA TGG GAT ATG ACC TTT ACC CCA CAA ATC CGC TAT AAA AGG GGT 720 
Asn Ser Trp Asp Met Thr Phe Thr Pro Gin He Arg Tyr Lys Arg Gly 
385 390 395 400 

TTT GGC TTG AAT TTT GAA GCG CGC TAC ATT AAC TCT AAA AAC GAC AGG 768 
Phe Gly Leu Asn Phe Glu Ala Arg Tyr He Asn Ser Lys Asn Asp Arg 
405 410 415 

TTT TTA TTC AAC GCG CGC TAT TTT AGG AAT TAC ACC CAA TAT GTC AAA 816 
Phe Leu Phe Asn Ala Arg Tyr Phe Arg Asn Tyr Thr Gin Tyr Val Lys 
420 425 430 

CGC TAC GAT TTG AGG AAT CAA AAT ATC TAC GGG TTT GAA TTT TTA AGC 864 
Arg Tyr Asp Leu Arg Asn Gin Asn He Tyr Gly Phe Glu Phe Leu Ser 
435 440 445 

TCT AGC AGG GAC ACT TTA CAA AAA TAC TTC CAC CTT AAG TCT AAT ATT 912 
Ser Ser Arg Asp Thr Leu Gin Lys Tyr Phe His Leu Lys Ser Asn He 
450 455 460 

GAC AAC GGG CAT TAC ATT GAC TTT TTA TAC ATG AAC GAT TTG GAC TAT 960 
Asp Asn Gly His Tyr He Asp Phe Leu Tyr Met Asn Asp Leu Asp Tyr 
465 470 475 480 

GTG CGT TTT GAA AAG GTT AAT AAG CGT ATC ACA GAC GCC ACG CAC ATG 1008 
Val Arg Phe Glu Lys Val Asn Lys Arg He Thr Asp Ala Thr His Met 
485 490 495 

TCT AGG GCG AAT TAC TAT TTG CAA ACA GAA AAC AAT TAT TAC GGC TTG 1056 
Ser Arg Ala Asn Tyr Tyr Leu Gin Thr Glu Asn Asn Tyr Tyr Gly Leu 
500 505 510 

AAT ATC AAG TAT TTT TTA AAC CTG AAT AAA ATC AAC AAT AAC CGC ACT 1104 
Asn He Lys Tyr Phe Leu Asn Leu Asn Lys He Asn Asn Asn Arg Thr 
515 520 525 
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TTC CAA TCT GTC CCT AAT TTG CAA TAC CAT AAA TAT TTA AAT TCT TTG 1152 
Phe Gin Ser Val Pro Asn Leu Gin Tyr His Lys Tyr Leu Asn Ser Leu 
530 535 540 

TAT TTT AGA AAT TTG TTG TAT TCG GTG GAT TAT CAG TTT AGA AAC ACC 1200 
Tyr Phe Arg Asn Leu Leu Tyr Ser Val Asp Tyr Gin Phe Arg Asn Thr 
545 550 555 560 

GCA AGA GAG ATT GGT TAT GGC TAT GTG CAA AAC GCT TTG AAT GTG CCG 1248 
Ala Arg Glu lie Gly Tyr Gly Tyr Val Gin Asn Ala Leu Asn Val Pro 
565 570 575 

GTG GGC TTG CAA TTT TCT TTG TTT AAA AAG TAT TTG TCT TTA GGG CTT 1296 
Val Gly Leu Gin Phe Ser Leu Phe Lys Lys Tyr Leu Ser Leu Gly Leu 
580 585 590 

TGG AAT GAT CTC CAA CTA TCT AAT GTG GCT TTA ATG CAA TCT AAA AAT 1344 
Trp Asn Asp Leu Gin Leu Ser Asn Val Ala Leu Met Gin Ser Lys Asn 
595 600 605 

TCC TTC GTG CCT ACG ATC CCT AAT GAA TCA AGG GAA TTT GGG AAT TTT 1392 
Ser Phe Val Pro Thr lie Pro Asn Glu Ser Arg Glu Phe Gly Asn Phe 
610 615 620 

GTG TCT TCA AAT TTT TCC ATG TAT GTC AAT ACG GAT TTG GCT AGA GAA 1440 
Val Ser Ser Asn Phe Ser Met Tyr Val Asn Thr Asp Leu Ala Arg Glu 
625 630 635 640 

TAC AAC AAG CTT TTC CAC ACG ATC CAA CTA GAA GCG ATT TTC AAC ATC 1488 
Tyr Asn Lys Leu Phe His Thr He Gin Leu Glu Ala He Phe Asn He 
645 650 655 

CCT TAT TAC ACC TTT AAA AAC GGC TTA TTT TCT CAA AAC ATG TAT GCT 1536 
Pro Tyr Tyr Thr Phe Lys Asn Gly Leu Phe Ser Gin Asn Met Tyr Ala 
660 665 670 

TTA AGC GCG CAA GCC TTA AAC AGC TAC ACT TCG CCT TTA TTG AGA GAT 1584 
Leu Ser Ala Gin Ala Leu Asn Ser Tyr Thr Ser Pro Leu Leu Arg Asp 
675 680 685 

TAT GAT TAT CAA GGG CGT TTG TAT GAC TCG GTG TGG AAT CCT AGC AGT 1632 
Tyr Asp Tyr Gin Gly Arg Leu Tyr Asp Ser Val Trp Asn Pro Ser Ser 
690 695 700 

ATT TTA CCT AGC AAT GCG AGC AAC AAG ACG GTG GAT TTA ACC CTA ACG 1680 
He Leu Pro Ser Asn Ala Ser Asn Lys Thr Val Asp Leu Thr Leu Thr 
705 710 715 720 

CAA TAC CTT TAT GGC TTA GGG GGG CAA GAG TTA TTG TAT TTT AAA ATA 1728 
Gin Tyr Leu Tyr Gly Leu Gly Gly Gin Glu Leu Leu Tyr Phe Lys He 
725 730 735 

TCG CAA CTC ATC AAT CTT GAC GAT AAA GTT TCG CCC TTT AGA ATG CCA 1776 
Ser Gin Leu He Asn Leu Asp Asp Lys Val Ser Pro Phe Arg Met Pro 
740 745 750 

CTA GAG AGC AAG ATC GGG TTT TCG CCC TTA ACG GGA TTG AAC ATC TTT 1824 
Leu Glu Ser Lys He Gly Phe Ser Pro Leu Thr Gly Leu Asn He Phe 
755 760 765 

GGG AAT GTC TTT TAT TCG TTT TAT CAA AAC CGC TTA GAA GAA ATC TCT 1872 
Gly Asn Val Phe Tyr Ser Phe Tyr Gin Asn Arg Leu Glu Glu He Ser 
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770 775 780 

GTG AAC GCC AAT TAG CAA CGC AAG TTT TTA AGC TTT AAC CTC TCT TAT 1920 
Val Asn Ala Asn Tyr Gin Arg Lys Phe Leu Ser Phe Asn Leu Ser Tyr 
785 790 795 800 

TTT TTA AAA AAC AAT TTT AGC AGT GGG ATT AAT AGC ATT GTA GAA AAT 1968 
Phe Leu Lys Asn Asn Phe Ser Ser Gly He Asn Ser He Val Glu Asn 
805 810 815 

CTG CGG ATT ATT TAA 1983 
Leu Arg He He * 
820 

(2) ANGABEN ZU SEQ ID NO: 26: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 661 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 26: 

Met He Tyr Trp Leu Tyr Leu Ala Val Phe Phe Leu Leu Ser Ala Leu 
15 10 15 

Asp Ala Lys Glu He Ala Met Gin Arg Phe Asp Lys Gin Asn His Lys 
20 25 30 

He Phe Glu He Leu Ala Asp Lys Val Ser Ala Lys Asp Asn Val He 
35 40 45 

Thr Ala Ser Gly Asn Ala He Leu Leu Asn Tyr Asp Val Tyr He Leu 
50 55 60 

Ala Asp Lys Val Arg Tyr Asp Thr Lys Thr Lys Glu Ala Leu Leu Glu 
65 70 75 80 

Gly Asn He Lys Val Tyr Arg Gly Glu Gly Leu Leu Val Lys Thr Asp 

85 90 95 

Tyr Val Lys Leu Ser Leu Asn Glu Lys Tyr Glu He He Phe Pro Phe 
100 105 HO 

Tyr Val Gin Asp Ser Val Ser Gly He Trp Val Ser Ala Asp He Ala 
115 120 125 

Ser Gly Lys Asp Gin Lys Tyr Lys Val Lys Asn Met Ser Thr Ser Gly 
130 135 140 

Cys Ser He Asp Asn Pro He Trp His Val Asn Ala Thr Ser Gly Ser 
145 150 155 160 

Phe Asn Met Gin Lys Ser His Leu Ser Met Trp Asn Pro Lys He Tyr 
165 170 175 

Val Gly Asp He Pro Val Leu Tyr Leu Pro Tyr He Phe Met Ser Thr 
180 185 190 

Ser Asn Lys Arg Thr Thr Gly Phe Leu Tyr Pro Glu Phe Gly Thr Ser 
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195 200 205 

Asn Leu Asp Gly Phe lie Tyr Leu Gin Pro Phe Tyr Leu Ala Pro Lys 
210 215 220 

Asn Ser Trp Asp Met Thr Phe Thr Pro Gin lie Arg Tyr Lys Arg Gly 
225 230 235 240 

Phe Gly Leu Asn Phe Glu Ala Arg Tyr lie Asn Ser Lys Asn Asp Arg 
245 250 255 

Phe Leu Phe Asn Ala Arg Tyr Phe Arg Asn Tyr Thr Gin Tyr Val Lys 
260 265 270 

Arg Tyr Asp Leu Arg Asn Gin Asn lie Tyr Gly Phe Glu Phe Leu Ser 
275 280 285 

Ser Ser Arg Asp Thr Leu Gin Lys Tyr Phe His Leu Lys Ser Asn He 
290 295 300 

Asp Asn Gly His Tyr lie Asp Phe Leu Tyr Met Asn Asp Leu Asp Tyr 
305 310 315 320 

Val Arg Phe Glu Lys Val Asn Lys Arg He Thr Asp Ala Thr His Met 
325 330 335 

Ser Arg Ala Asn Tyr Tyr Leu Gin Thr Glu Asn Asn Tyr Tyr Gly Leu 
340 345 350 

Asn He Lys Tyr Phe Leu Asn Leu Asn Lys He Asn Asn Asn Arg Thr 
355 360 365 

Phe Gin Ser Val Pro Asn Leu Gin Tyr His Lys Tyr Leu Asn Ser Leu 
370 375 380 

Tyr Phe Arg Asn Leu Leu Tyr Ser Val Asp Tyr Gin Phe Arg Asn Thr 
385 390 395 400 

Ala Arg Glu He Gly Tyr Gly Tyr Val Gin Asn Ala Leu Asn Val Pro 
405 410 415 

Val Gly Leu Gin Phe Ser Leu Phe Lys Lys Tyr Leu Ser Leu Gly Leu 
420 425 430 

Trp Asn Asp Leu Gin Leu Ser Asn Val Ala Leu Met Gin Ser Lys Asn 
435 440 445 

Ser Phe Val Pro Thr He Pro Asn Glu Ser Arg Glu Phe Gly Asn Phe 
450 455 460 

Val Ser Ser Asn Phe Ser Met Tyr Val Asn Thr Asp Leu Ala Arg Glu 
465 470 475 480 

Tyr Asn Lys Leu Phe His Thr He Gin Leu Glu Ala He Phe Asn He 
485 490 495 

Pro Tyr Tyr Thr Phe Lys Asn Gly Leu Phe Ser Gin Asn Met Tyr Ala 
500 505 510 

Leu Ser Ala Gin Ala Leu Asn Ser Tyr Thr Ser Pro Leu Leu Arg Asp 
515 520 525 
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Tyr Asp Tyr Gin Gly Arg Leu Tyr Asp Ser Val Trp Asn Pro Ser Ser 
530 535 540 

He Leu Pro Ser Asn Ala Ser Asn Lys Thr Val Asp Leu Thr Leu Thr 
545 550 555 560 

Gin Tyr Leu Tyr Gly Leu Gly Gly Gin Glu Leu Leu Tyr Phe Lys He 
565 570 575 

Ser Gin Leu He Asn Leu Asp Asp Lys Val Ser Pro Phe Arg Met Pro 
580 585 590 

Leu Glu Ser Lys He Gly Phe Ser Pro Leu Thr Gly Leu Asn He Phe 
595 600 605 

Gly Asn Val Phe Tyr Ser Phe Tyr Gin Asn Arg Leu Glu Glu He Ser 
610 615 620 

Val Asn Ala Asn Tyr Gin Arg Lys Phe Leu Ser Phe Asn Leu Ser Tyr 
625 63V 635 640 

Phe Leu Lys Asn Asn Phe Ser Ser Gly He Asn Ser He Val Glu Asn 
645 650 655 

Leu Arg He He * 
660 

(2) ANGABEN ZU SEQ ID NO: 27: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 372 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT: 
(B) CLON(E) : HPC085 

(ix) MERKMAL: 

(A) NAME/ SCHLUSSEL : CDS 

(B) LAGE:1..372 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 27: 

ATG CGT TTG TTT ATC TCA CTA GTT TTG TTT TGG TGG TGG TTA AGT TTG 48 
Met Arg Leu Phe He Ser Leu Val Leu Phe Trp Trp Trp Leu Ser Leu 
665 670 675 

AAC GCT AAA GAA GCG GAT TTC ATC TCT GAT TTG GAA TAG GGG ATG GCT 96 
Asn Ala Lys Glu Ala Asp Phe He Ser Asp Leu Glu Tyr Gly Met Ala 
680 685 690 

CTT TAT AAA AAC CCT AGG GGT GTT GCG TGC GCG AAA TGC CAT GGC ATT 144 
Leu Tyr Lys Asn Pro Arg Gly Val Ala Cys Ala Lys Cys His Gly He 
695 700 705 

AAA GGC GAA CAA CAA GAA ATC ACT TTT TAT TAT GAA AAA GGC GAA AAA 192 
Lys Gly Glu Gin Gin Glu He Thr Phe Tyr Tyr Glu Lys Gly Glu Lys 
710 715 720 725 
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AAA ATC CTC TAC GCC CCT AAA ATC AAC CAT TTA GAT TTT AAA ACC TTT 240 
Lys lie Leu Tyr Ala Pro Lys He Asn His Leu Asp Phe Lys Thr Phe 
730 735 740 

AAA GAG GCC CTG AGT TTA GGC AAA GGC ATG ATG CCT AAA TAC AAT CTC 288 
Lys Asp Ala Leu Ser Leu Gly Lys Gly Met Met Pro Lys Tyr Asn Leu 
745 750 755 

AAT TTA GAA GAA ATC CAA GCG ATT TAC CTT TAC ATC ACC TCT TTA GAG 336 
Asn Leu Glu Glu He Gin Ala He Tyr Leu Tyr He Thr Ser Leu Glu 
760 765 770 

CAT AAA GAC GAG CAT AAG AAT CCT TCC AAG CCT TAA 372 
His Lys Asp Glu His Lys Asn Pro Ser Lys Pro * 
775 780 785 



(2) ANGABEN ZU SEQ ID NO: 28: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 124 Aminosauren 

(B) ART: Aminos aure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO : 28: 

Met Arg Leu Phe He Ser Leu Val Leu Phe Trp Trp Trp Leu Ser Leu 
15 10 15 

Asn Ala Lys Glu Ala Asp Phe He Ser Asp Leu Glu Tyr Gly Met Ala 
20 25 30 

Leu Tyr Lys Asn Pro Arg Gly Val Ala Cys Ala Lys Cys His Gly He 
35 40 45 

Lys Gly Glu Gin Gin Glu He Thr Phe Tyr Tyr Glu Lys Gly Glu Lys 
50 55 60 

Lys He Leu Tyr Ala Pro Lys He Asn His Leu Asp Phe Lys Thr Phe 
65 70 75 80 

Lys Asp Ala Leu Ser Leu Gly Lys Gly Met Met Pro Lys Tyr Asn Leu 
85 90 95 

Asn Leu Glu Glu He Gin Ala He Tyr Leu Tyr He Thr Ser Leu Glu 
100 105 110 

His Lys Asp Glu His Lys Asn Pro Ser Lys Pro * 
115 120 

(2) ANGABEN ZU SEQ ID NO: 29: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE : 558 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE : linear 



(vii) 



UNMITTELBARE HERKUNFT: 
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(B) CLON(E) : HPC090 

(ix) MERKMAL: 

(A) NAME/ SCHLUSSEL : CDS 

(B) LAGE:1..S58 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 29: 

ATG CGT TGG TGG TGT TTT TTG GTG TGT TGT TTT GGT ATT TTA AGC GTG 4 8 

Met Arg Trp Trp Cys Phe Leu Val Cys Cys Phe Gly He Leu Ser Val 
125 130 135 140 

ATG GAC GCT CAA AAA ACA GAC AAT AAA GGT TTG AAA AAA GAA AGA GAA 96 
Met Asp Ala Gin Lys Thr Asp Asn Lys Gly Leu Lys Lys Glu Arg Glu 
145 150 155 

CTT TTA GAA ATT ACT GGC AAC CAA TTT GTA GCG AAC GAC AAA ACC AAA 144 
Leu Leu Glu He Thr Gly Asn Gin Phe Val Ala Asn Asp Lys Thr Lys 
160 165 170 

ACC GCC GTT ATT CAA GGC AAT GTG CAG ATC AAA AAA GGT AAA GAC CGG 192 
Thr Ala Val He Gin Gly Asn Val Gin He Lys Lys Gly Lys Asp Arg 
175 180 185 

TTG TTT GCG GAT AAG GTG AGC GTG TTT TTA AAC GAT AAA CGA AAG CCA 240 
Leu Phe Ala Asp Lys Val Ser Val Phe Leu Asn Asp Lys Arg Lys Pro 
190 195 200 

GAG CGC TAT GAA GCC ACA GGG AAC ACG CAT TTT AAC ATC TTT ACA GAG 288 
Gl\i Arg Tyr Glu Ala Thr Gly Asn Thr His Phe Asn He Phe Thr Glu 
205 210 215 220 

GAC AAT CGT GAA ATC AGC GGG AGC GCT GAC AAG CTC ATT TAT AAC GCA 336 
Asp Asn Arg Glu He Ser Gly Ser Ala Asp Lys Leu He Tyr Asn Ala 
225 230 235 

TTG AAT GGG GAA TAC AAA TTA TTG CAA AAT GCG GTG GTT AGA GAA GTG 384 
Leu Asn Gly Glu Tyr Lys Leu Leu Gin Asn Ala Val Val Arg Glu Val 
240 245 250 

GGG AAA TCT AAT GTC ATC ACT GGC GAT GAA ATC ATT TTA AAC AAA ACT 432 
Gly Lys Ser Asn Val He Thr Gly Asp Glu He He Leu Asn Lys Thr 
255 260 265 

AAG GGT TAT GCT GAT GTG TTA GGG AGC GCG AAA CGG CCC GCT AAA TTC 480 
Lys Gly Tyr Ala Asp Val Leu Gly Ser Ala Lys Arg Pro Ala Lys Phe 
270 275 280 

GTG TTT GAT ATG GAA GAT ATT AAT GAA GAA AAT CGT AAG GCT AAA TTG 528 
Val Phe Asp Met Glu Asp He Asn Glu Glu Asn Arg Lys Ala Lys Leu 
285 290 295 300 

AAG AAG AAA GGC ACT AAG GAA AAA CCA TGA 558 
Lys Lys Lys Gly Thr Lys Glu Lys Pro * 
305 310 

(2) ANGABEN ZU SEQ ID NO: 30: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 186 Aminosauren 



L 
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(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Protein 

(xi) SEQUENZBESCHREIBUNG : SEQ ID NO: 30: 

Met Arg Trp Trp Cys Phe Leu Val Cys Cys Phe Gly lie Leu Ser Val 
15 10 15 

Met Asp Ala Gin Lys Thr Asp Asn Lys Gly Leu Lys Lys Glu Arg Glu 
20 25 30 

Leu Leu Glu He Thr Gly Asn Gin Phe Val Ala Asn Asp Lys Thr Lys 
35 40 45 

Thr Ala Val He Gin Gly Asn Val Gin He Lys Lys Gly Lys Asp Arg 
50 55 60 

Leu Phe Ala Asp Lys Val Ser Val Phe Leu Asn Asp Lys Arg Lys Pro 
65 70 75 80 

Glu Arg Tyr Glu Ala Thr Gly Asn Thr His Phe Asn He Phe Thr Glu 
85 90 95 

Asp Asn Arg Glu He Ser Gly Ser Ala Asp Lys Leu He Tyr Asn Ala 
100 105 110 

Leu Asn Gly Glu Tyr Lys Leu Leu Gin Asn Ala Val Val Arg Glu Val 
115 120 125 

Gly Lys Ser Asn Val He Thr Gly Asp Glu He He Leu Asn Lys Thr 
130 135 140 

Lys Gly Tyr Ala Asp Val Leu Gly Ser Ala Lys Arg Pro Ala Lys Phe 
145 150 155 160 

Val Phe Asp Met Glu Asp He Asn Glu Glu Ash Arg Lys Ala Lys Leu 
165 170 175 

Lys Lys Lys Gly Thr Lys Glu Lys Pro * 
180 185 

(2) ANGABEN ZU SEQ ID NO: 31: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 768 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT : 
(B) CLON{E) : HPS104 

(ix) MERKMAL: 

(A) NAME/ SCHLUSSEL : CDS 

(B) LAGE:1..768 



(xi) 



SEQUENZBESCHREIBUNG : SEQ ID NO: 31: 
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ATG GAT ATT TAT GCG TTA TAT ATA GCG ATA GGG CTT TTT ACT GGC ATT 48 
Met Asp lie Tyr Ala Leu Tyr lie Ala He Gly Leu Phe Thr Gly He 
190 195 200 

CTA TCA GGG ATT TTT GGC ATT GGT GGG GGG TTG ATC ATT GTC CCT ATC 96 
Leu Ser Gly He Phe Gly He Gly Gly Gly Leu He He Val Pro He 
205 210 215 

ATG CTC GCA ACC GGG CAT TCT TTT GAA GAA TCC ATT GGG ATT TCC ATT 144 
Met Leu Ala Thr Gly His Ser Phe Glu Glu Ser He Gly He Ser He 
220 225 230 

TTG CAA ATG GCG CTT TCA TCG TTC GTG GGC TCT GTT TTG AAT TTC AAA 192 
Leu Gin Met Ala Leu Ser Ser Phe Val Gly Ser Val Leu Asn Phe Lys 
235 240 245 250 

AAA AAA TCG CTT GAT TTT TCT TTA GGC TTG TTG ATA GGG GCA GGG GGG 240 
Lys Lys Ser Leu Asp Phe Ser Leu Gly Leu Leu He Gly Ala Gly Gly 
255 260 265 

CTG ATA GGG GCG AGT TTT AGC GGA TTT GTT TTA AAA ATC GTT TCC AGT 288 
Leu He Gly Ala Ser Phe Ser Gly Phe Val Leu Lys He Val Ser Ser 
270 275 280 

AAA ATT TTA ATG GTT ATT TTC GCG CTT TTA GTC GTG TAT TCT ATG ATC 336 
Lys He Leu Met Val He Phe Ala Leu Leu Val Val Tyr Ser Met He 
285 290 295 

CAA TTT GTT TTG AAA CCC AAA AAA AAA GAT TTG ATA GCG GAT ACT AAA 384 
Gin Phe Val Leu Lys Pro Lys Lys Lys Asp Leu He Ala Asp Thr Lys 
300 305 310 

CGC TAT CAT CTG CAA GGT TTG AAA TTA TTT TTA ATT GGC ACG CTC ACA 432 
Arg Tyr His Leu Gin Gly Leu Lys Leu Phe Leu He Gly Thr Leu Thr 
315 320 325 330 

GGG TTT TTT GCT ATC ACT TTA GGG ATT GGT GGG GGG ATG CTC ATG GTG 480 
Gly Phe Phe Ala He Thr Leu Gly He Gly Gly Gly Met Leu Met Val 
335 340 345 

CCT TTG ATG CAT TAT TTT TTA GGG TAT GAT TCT AAA AAA TGC GTG GCT 528 
Pro Leu Met His Tyr Phe Leu Gly Tyr Asp Ser Lys Lys Cys Val Ala 
350 355 360 

CTA GGG TTA TTT TTC ATC TTG TTT TCT TCT ATT TCA GGA GCT TTT TCT 576 
Leu Gly Leu Phe Phe He Leu Phe Ser Ser He Ser Gly Ala Phe Ser 
365 370 375 

TTA ATG TAT CAC CAC ATC ATC AAT AAA GAA GTG CTC TTA GCA GGG GCG 624 
Leu Met Tyr His His He He Asn Lys Glu Val Leu Leu Ala Gly Ala 
380 385 390 

ATT GTG GGA TTA GGA TCT GTT ATG GGC GTG AGC ATT GGG ATT AAA TGG 672 
He Val Gly Leu Gly Ser Val Met Gly Val Ser He Gly He Lys Trp 
395 400 405 410 

ATC ATG GGG CTT TTG AAT GAA AAA ATG CAT AAA GCT TTG ATT TTA GGG 720 
He Met Gly Leu Leu Asn Glu Lys Met His Lys Ala Leu He Leu Gly 
415 420 425 

GTG TAT GGT TTG TCG CTA TTG ATT GTT TTA TAC AAA CTC TTT TTT TAA 768 
Val Tyr Gly Leu Ser Leu Leu He Val Leu Tyr Lys Leu Phe Phe * 
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430 435 440 

(2) ANGABEN ZU SEQ ID NO: 32: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 256 Aminosauren 
(6) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Protein 

(xi) SEQUENZBESCHREIBUNG : SEQ ID NO: 32: 

Met Asp lie Tyr Ala I#eu Tyr lie Ala lie Gly Leu Phe Thr Gly lie 
1 5 10 15 

Leu Ser Gly lie Phe Gly lie Gly Gly Gly Leu lie lie Val Pro He 
20 25 30 

Met Leu Ala Thr Gly His Ser Phe Glu Glu Ser He Gly He Ser He 
35 40 45 

Leu Gin Met Ala Leu Ser Ser Phe Val Gly Ser Val Leu Asn Phe Lys 
50 55 60 

Lys Lys Ser Leu Asp Phe Ser Leu Gly Leu Leu He Gly Ala Gly Gly 
65 70 75 80 

Leu He Gly Ala Ser Phe Ser Gly Phe Val Leu Lys He Val Ser Ser 
85 90 95 

Lys He Leu Met Val He Phe Ala Leu Leu Val Val Tyr Ser Met He 
100 105 110 

Gin Phe Val Leu Lys Pro Lys Lys Lys Asp Leu He Ala Asp Thr Lys 
115 120 125 

Arg Tyr His Leu Gin Gly Leu Lys Leu Phe Leu He Gly Thr Leu Thr 
130 135 140 

Gly Phe Phe Ala He Thr Leu Gly He Gly Gly Gly Met Leu Met Val 
145 150 155 160 

Pro Leu Met His Tyr Phe Leu Gly Tyr Asp Ser Lys Lys Cys Val Ala 
165 170 175 

Leu Gly Leu Phe Phe He Leu Phe Ser Ser He Ser Gly Ala Phe Ser 
180 185 190 

Leu Met Tyr His His He He Asn Lys Glu Val Leu Leu Ala Gly Ala 
195 200 205 

He Val Gly Leu Gly Ser Val Met Gly Val Ser He Gly He Lys Trp 
210 215 220 

He Met Gly Leu Leu Asn Glu Lys Met His Lys Ala Leu He Leu Gly 
225 230 235 240 

Val Tyr Gly Leu Ser Leu Leu He Val Leu Tyr Lys Leu Phe Phe * 
245 250 255 



WO 00/73502 



PCT/EP00/05024 



43 



(2) ANGABEN ZU SEQ ID NO: 33: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 2 367 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNMI TTELBARE HERKUNFT : 
(B) CLON(E) : HPS115 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE:1..2367 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 33: 

ATG AAA TGT TCG CAT TGC CAG TTG GAG TTT AAA GAA AGT GAG CTT TTT 48 
Met Lys Cys Ser His Cys Gin Leu Glu Phe Lys Glu Ser Glu Leu Phe 
260 265 270 

AAA GAG GTG ATC AAT CAT AAA GAA TTG CAT TTT TGC TGC ACG GGG TGC 96 
Lys Glu Val lie Asn His Lys Glu Leu His Phe Cys Cys Thr Gly Cys 
275 280 285 

GCT AGG GTG TAT GCG TTA TTG TTA GAT TTG AAT TTA GAG AGC TTT TAT 144 
Ala Arg Val Tyr Ala Leu Leu Leu Asp Leu Asn Leu Glu Ser Phe Tyr 
290 295 300 

GAC AAA TTA AAC GAT TCC ACT TTA GCC CCC GTA ACG CCC CAA GAT TCA 192 
Asp Lys Leu Asn Asp Ser Thr Leu Ala Pro Val Thr Pro Gin Asp Ser 
305 310 315 320 

ATG AGC GCT TTG GAA TTA GAA CAA GCC CTT GAA GAA AAC AAT AAG GGC 240 
Met Ser Ala Leu Glu Leu Glu Gin Ala Leu Glu Glu Asn Asn Lys Gly 
325 330 335 

GAT TTT ATC CTT AAT CTT TTG TTA GAA AAA ACG CAT TGT AAC GCT TGC 288 
Asp Phe lie Leu Asn Leu Leu Leu Glu Lys Thr His Cys Asn Ala Cys 
340 345 350 

TTG TGG CTC AAT CAA AAG GTT TTA GAA CGT TTA AGT GGG GTT AAA AAA 336 
Leu Trp Leu Asn Gin Lys Val Leu Glu Arg Leu Ser Gly Val Lys Lys 
355 360 365 

GTG AGC GTG AAT TTC ACC ACC CAC CAC TTG CAA ATC GTG TTT GAG AAG 384 
Val Ser Val Asn Phe Thr Thr His His Leu Gin He Val Phe Glu Lys 
370 375 380 

TCC TTA AAC CCT AAA GAG ATT ATT CAA AAA ATT GAG AGT TTG GGC TAT 432 
Ser Leu Asn Pro Lys Glu He He Gin Lys He Glu Ser Leu Gly Tyr 
385 390 395 400 

GGG GCT AAA ATT TAT AAT GCG CAA AAT TAC ACC CTA AAA GCG CAA AAA 480 
Gly Ala Lys He Tyr Asn Ala Gin Asn Tyr Thr Leu Lys Ala Gin Lys 
405 410 415 

GAA CAG CGC TCC TAC TTG CTC ACT TTG AGC GTG GGG TTT TTT GCC ACT 528 
Glu Gin Arg Ser Tyr Leu Leu Thr Leu Ser Val Gly Phe Phe Ala Thr 
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420 425 430 

ATG AAT TTG ATG TTT ATC GCC ATT GCC AAA TAC GCA AGT TAT GGT GGC 576 
Met Asn Leu Met Phe lie Ala lie Ala Lys Tyr Ala Ser Tyr Gly Gly 
435 440 445 

GCA AGT TAT GGC GGT GCG AAT TAT GGC GCT GGC ATG GAT AAG CTT ATG 624 
Ala Ser Tyr Gly Gly Ala Asn Tyr Gly Ala Gly Met Asp Lys Leu Met 
450 455 460 

CAA AGG AAT TTG GAT CTC GTA TCG CTC TTT TTA AGC TTG TTG GTG TTA 672 
Gin Arg Asn Leu Asp Leu Val Ser Leu Phe Leu Ser Leu Leu Val Leu 
465 470 475 480 

GTG GTT GTG GGG CGT TTT TTC ATT AAG GGG GCG TTT TAT GGG CTA AAA 720 
Val Val Val Gly Arg Phe Phe lie Lys Gly Ala Phe Tyr Gly Leu Lys 
485 490 495 

AAT GGC GTT TTG GGC ATG GAT TTG AGC GTG TCT TTT GGA GCG TTA TCG 768 
Asn Gly Val Leu Gly Met Asp Leu Ser Val Ser Phe Gly Ala Leu Ser 
500 505 510 

GCG TTT GTT TAT TCC GTT TAT GCC ATG TTG GTG TCC CAA GAG ACT TAT 816 
Ala Phe Val Tyr Ser Val Tyr Ala Met Leu Val Ser Gin Glu Thr Tyr 
515 520 525 

TTT GAA GCG AGC AGC ACG ATT CTA ACG CTT GTT TTT GGC TCT AAG TTT 864 
Phe Glu Ala Ser Ser Thr lie Leu Thr Leu Val Phe Gly Ser Lys Phe 
530 535 540 

TTG GAA TTA AAA GCC AGG CTG TTT GCG AAT GAA AAA TGT CTG GCC CTA 912 
Leu Glu Leu Lys Ala Arg Leu Phe Ala Asn Glu Lys Cys Leu Ala Leu 
545 550 555 560 

GAA TCG CAT GAA ATC CAT AGC GTG ATC GTT GTA GAA AAT GGC AAG CAA 960 
Glu Ser His Glu lie His Ser Val lie Val Val Glu Asn Gly Lys Gin 
565 570 575 

ACA GAA AAA CAC CCT AAA GAT GTG GCG ATA GGC TCT GTT GTT TGG GTG 1008 
Thr Glu Lys His Pro Lys Asp Val Ala lie Gly Ser Val Val Trp Val 
580 585 590 

CCA AGC GGG GCT AAA ATC GCA CTA GAT GGC GTG CTT TTA AAT AAT GCG 1056 
Pro Ser Gly Ala Lys lie Ala Leu Asp Gly Val Leu Leu Asn Asn Ala 
595 600 605 

AGC GTG GAT GCG TCT TTG ATC AGT GGG GAG TTT AAG CCT TTG GAA TTG 1104 
Ser Val Asp Ala Ser Leu "lie Ser Gly Glu Phe Lys Pro Leu Glu Leu 
610 615 620 

GGG GTT AAT GAT CCA ATT TTA GGG GGT TAT GTG AAT GTG GGC GTG CCT 1152 
Gly Val Asn Asp Pro lie Leu Gly Gly Tyr Val Asn Val Gly Val Pro 
625 630 635 640 

TTT AGC TAT CAA GTG AGC GCT AAT TTT CAA AAC TCA CGC CTT TCT GGT 1200 
Phe Ser Tyr Gin Val Ser Ala Asn Phe Gin Asn Ser Arg Leu Ser Gly 
645 650 655 

TTG TTA GAA ACT TTA AAA AAG AGT TTT TTA GAA AAG CCC TTA ATT GAG 1248 
Leu Leu Glu Thr Leu Lys Lys Ser Phe Leu Glu Lys Pro Leu lie Glu 
660 665 670 
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AGT AGC GCG AAT CAA ATT GCG GAT ATT TTT TCT AAA GCG GTG TTG TTT 1296 

Ser Ser Ala Asn Gin lie Ala Asp lie Phe Ser Lys Ala Val Leu Phe 
675 680 685 

TTA GCC TTT GTA AGC TTT TTG TTA TGG CAA TTT GGT TTG GGG GGT AAT 1344 
Leu Ala Phe Val Ser Phe Leu Leu Trp Gin Phe Gly Leu Gly Gly Asn 
690 695 700 

TTT GAA AAA GCC TTA ATG GTG TGT ATT AGC GTG CTA GTC ATC AGC TGC 13 92 

Phe Glu Lys Ala Leu Met Val Cys He Ser Val Leu Val He Ser Cys 
705 710 715 720 

CCT TGC GCG TTC GCT CTG GCT ACG CCC ATT GCG TTA GTG ATA GGG GTG 1440 
Pro Cys Ala Phe Ala Leu Ala Thr Pro He Ala Leu Val He Gly Val 
725 730 735 

TTT AAA AAC CCT TTG ATC GTG TTT AAA GAA GCG TTG TTT TTA GAA ACT 1488 
Phe Lys Asn Pro Leu He Val Phe Lys Glu Ala Leu Phe Leu Glu Thr 
740 745 750 

CTG GCT AAA GTG AAA AAA ATC TTT ATA GAC AAA ACC GGC ACG CTC ACG 1536 
Leu Ala Lys Val Lys Lys He Phe He Asp Lys Thr Gly Thr Leu Thr 
755 760 765 

CAA AAA GAA GTC CTT TTA AAA GAA AAA ATC ATT TAT GAA GAA TTT GAT 1584 
Gin Lys Glu Val Leu Leu Lys Glu Lys He He Tyr Glu Glu Phe Asp 
770 775 780 

GGA AGG CTT TTG AAG AGC CTT TTA AAA GTG AGA GAG CAT TTA GCC CAT 1632 
Gly Arg Leu Leu Lys Ser Leu Leu Lys Val Arg Glu His Leu Ala His 
785 790 795 800 

AGC GCG ATT CTT AAA TCT CTA GAT GGC GAT GAG GTT AGT TTA GAA AAG 1680 
Ser Ala He Leu Lys Ser Leu Asp Gly Asp Glu Val Ser Leu Glu Lys 
805 810 815 

ATA GAG TTT TTC GCT CAT GGT CTG AAA GCG AGC TAT CAA AAC GAA ACC 1728 
He Glu Phe Phe Ala His Gly Leu Lys Ala Ser Tyr Gin Asn Glu Thr 
820 825 830 

CTG CTA GTG GGG AGT TTG AAA TTT TTG GGA TCT ATG GGG GTG GAT ATA 1776 
Leu Leu Val Gly Ser Leu Lys Phe Leu Gly Ser Met Gly Val Asp He 
835 840 845 

CCA ATG AAA GAG AGC GCT AAT ATC ATG GTA GGC TTT GCG AAA AAT GAG 1824 
Pro Met Lys Glu Ser Ala Asn He Met Val Gly Phe Ala Lys Asn Glu 
850 855 860 

ACT TTA TGC GCG TTA TTC ATT TTA GAA GAG CGT TTG AAA GCT AAC GCT 1872 
Thr Leu Cys Ala Leu Phe He Leu Glu Glu Arg Leu Lys Ala Asn Ala 
865 870 875 880 

AAA GAA GTC GTT CAG GCT TTA CAA AAT AAA GGC TTA GAA TTA GAG ATT 1920 
Lys Glu Val Val Gin Ala Leu Gin Asn Lys Gly Leu Glu Leu Glu He 
885 890 895 

TTA AGC GGG GAT AAT GAA AGC TCG GTT AAG GAG TGC GCG AAA AAA TTA 1968 
Leu Ser Gly Asp Asn Glu Ser Ser Val Lys Glu Cys Ala Lys Lys Leu 
900 905 910 

GGG ATT TCT AAT TAT CAT GCC CAT TTG ACC CCT GAA GAT AAG GCT CAA 2016 
Gly He Ser Asn Tyr His Ala His Leu Thr Pro Glu Asp Lys Ala Gin 
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915 920 925 

ACC ATC AGC TCT TAT AAG GGC GTT TGC GCG ATG GTA GGC GAT GGC AAT 2064 
Thr lie Ser Ser Tyr Lys Gly Val Cys Ala Met Val Gly Asp Gly Asn 
930 935 940 

AAT GAT GCG TTA GCC TTA AAA CAA GCG AGC GTT TCT TTA GGG TTT GAA 2112 
Asn Asp Ala Leu Ala Leu Lys Gin Ala Ser Val Ser Leu Gly Phe Glu 
945 950 955 960 

AAA AGC GCT TTG AGT AAA AGC GCA TGC GAT ATT TTG CTT TTA GAA GAG 2160 
Lys Ser Ala Leu Ser Lys Ser Ala Cys Asp lie Leu Leu Leu Glu Glu 
965 970 975 

GAT TTG AGT TTG CTA AAA AAA GCG TTT GAT AAC GCT CAA AAA GTC TAT 2208 
Asp Leu Ser Leu Leu Lys Lys Ala Phe Asp Asn Ala Gin Lys Val Tyr 
980 985 990 

CAA GTG GTG TTG CAA AAC ATT GTT TTG AGC TTG ATT TAT AAC GCT ATT 2256 
Gin Val Val Leu Gin Asn lie Val Leu Ser Leu lie Tyr Asn Ala lie 
995 1000 1005 

TTA ATC CCG GTC GCT ATG CTA GGA TAC ATT AAC CCT TTA ATA GCG AGT 2304 
Leu lie Pro Val Ala Met Leu Gly Tyr lie Asn Pro Leu lie Ala Ser 
1010 1015 1020 

TTG AGC ATG AGC GCT AGC TCA CTC TTA GTG GTC TTA AAT TCT TTG AGG 2352 
Leu Ser Met Ser Ala Ser Ser Leu Leu Val Val Leu Asn Ser Leu Arg 
1025 1030 1035 1040 

TTG AAA CGC TCT TAA 2367 
Leu Lys Arg Ser * 

1045 



(2) ANGABEN ZU SEQ ID NO: 34: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 789 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEK&LS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 34: 

Met Lys Cys Ser His Cys Gin Leu Glu Phe Lys Glu Ser Glu Leu Phe 
15 10 15 

Lys Glu Val lie Asn His Lys Glu Leu His Phe Cys Cys Thr Gly Cys 
20 25 30 

Ala Arg Val Tyr Ala Leu Leu Leu Asp Leu Asn Leu Glu Ser Phe Tyr 
35 40 45 

Asp Lys Leu Asn Asp Ser Thr Leu Ala Pro Val Thr Pro Gin Asp Ser 
50 55 60 

Met Ser Ala Leu Glu Leu Glu Gin Ala Leu Glu Glu Asn Asn Lys Gly 
65 70 75 80 

Asp Phe lie Leu Asn Leu Leu Leu Glu Lys Thr His Cys Asn Ala Cys 
85 90 95 
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Leu Trp Leu Asn Gin Lys Val Leu Glu Arg Leu Ser Gly Val Lys Lys 
100 105 110 

Val Ser Val Asn Phe Thr Thr His His Leu Gin lie Val Phe Glu Lys 
115 120 125 

Ser Leu Asn Pro Lys Glu lie lie Gin Lys lie Glu Ser Leu Gly Tyr 
130 135 140 

Gly Ala Lys lie Tyr Asn Ala Gin Asn Tyr Thr Leu Lys Ala Gin Lys 
145 150 155 160 

Glu Gin Arg Ser Tyr Leu Leu Thr Leu Ser Val Gly Phe Phe Ala Thr 
165 170 175 

Met Asn Leu Met Phe lie Ala He Ala Lys Tyr Ala Ser Tyr Gly Gly 
180 185 190 

Ala Ser Tyr Gly Gly Ala Asn Tyr Gly Ala Gly Met Asp Lys Leu Met 
195 200 205 

Gin Arg Asn Leu Asp Leu Val Ser Leu Phe leu Ser Leu Leu Val Leu 
210 215 220 

Val Val Val Gly Arg Phe Phe He Lys Gly Ala Phe Tyr Gly Leu Lys 
225 230 235 240 

Asn Gly Val Leu Gly Met Asp Leu Ser Val Ser Phe Gly Ala Leu Ser 
245 250 255 

Ala Phe Val Tyr Ser Val Tyr Ala Met Leu Val Ser Gin Glu Thr Tyr 
260 265 270 

Phe Glu Ala Ser Ser Thr He Leu Thr Leu Val Phe Gly Ser Lys Phe 
275 280 285 

Leu Glu Leu Lys Ala Arg Leu Phe Ala Asn Glu Lys Cys Leu Ala Leu 
290 295 300 

Glu Ser His Glu He His Ser Val He Val Val Glu Asn Gly Lys Gin 
305 310 315 320 

Thr Glu Lys His Pro Lys Asp Val Ala He Gly Ser Val Val Trp Val 
325 330 335 

Pro Ser Gly Ala Lys He Ala Leu Asp Gly Val Leu Leu Asn Asn Ala 
340 345 350 

Ser Val Asp Ala Ser Leu He Ser Gly Glu Phe Lys Pro Leu Glu Leu 
355 360 365 

Gly Val Asn Asp Pro He Leu Gly Gly Tyr Val Asn Val Gly Val Pro 
370 375 380 

Phe Ser Tyr Gin Val Ser Ala Asn Phe Gin Asn Ser Arg Leu Ser Gly 
385 390 395 400 

Leu Leu Glu Thr Leu Lys Lys Ser Phe Leu Glu Lys Pro Leu He Glu 
405 410 415 

Ser Ser Ala Asn Gin He Ala Asp He Phe Ser Lys Ala Val Leu Phe 
420 425 430 
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Leu Ala Phe Val Ser Phe Leu Leu Trp Gin Phe Gly Leu Gly Gly Asn 
435 440 445 

Phe Glu Lys Ala Leu Met Val Cys He Ser Val Leu Val He Ser Cys 
450 455 460 

Pro Cys Ala Phe Ala Leu Ala Thr Pro He Ala Leu Val He Gly Val 
465 470 475 480 

Phe Lys Asn Pro Leu He Val Phe Lys Glu Ala Leu Phe Leu Glu Thr 
485 490 495 

Leu Ala Lys Val Lys Lys He Phe He Asp Lys Thr Gly Thr Leu Thr 
500 505 510 

Gin Lys Glu Val Leu Leu Lys Glu Lys He He Tyr Glu Glu Phe Asp 
515 520 525 

Gly Arg Leu Leu Lys Ser Leu Leu Lys Val Arg Glu His Leu Ala His 
530 535 540 

Ser Ala He Leu Lys Ser Leu Asp Gly Asp Glu Val Ser Leu Glu Lys 
545 550 555 560 

He Glu Phe Phe Ala His Gly Leu Lys Ala Ser Tyr Gin Asn Glu Thr 
565 570 575 

Leu Leu Val Gly Ser Leu Lys Phe Leu Gly Ser Met Gly Val Asp He 
580 585 590 

Pro Met Lys Glu Ser Ala Asn He Met Val Gly Phe Ala Lys Asn Glu 
595 600 605 

Thr Leu Cys Ala Leu Phe He Leu Glu Glu Arg Leu Lys Ala Asn Ala 
610 615 620 

Lys Glu Val Val Gin Ala Leu Gin Asn Lys Gly Leu Glu Leu Glu He 
625 630 635 640 

Leu Ser Gly Asp Asn Glu Ser Ser Val Lys Glu Cys Ala Lys Lys Leu 
645 650 655 

Gly He Ser Asn Tyr His Ala His Leu Thr Pro Glu Asp Lys Ala Gin 
660 665 670 

Thr He Ser Ser Tyr Lys Gly Val Cys Ala Met Val Gly Asp Gly Asn 
675 680 685 

Asn Asp Ala Leu Ala Leu Lys Gin Ala Ser Val Ser Leu Gly Phe Glu 
690 695 700 

Lys Ser Ala Leu Ser Lys Ser Ala Cys Asp He Leu Leu Leu Glu Glu 
705 710 715 720 

Asp Leu Ser Leu Leu Lys Lys Ala Phe Asp Asn Ala Gin Lys Val Tyr 
725 730 735 

Gin Val Val Leu Gin Asn He Val Leu Ser Leu He Tyr Asn Ala He 
740 745 750 

Leu He Pro Val Ala Met Leu Gly Tyr He Asn Pro Leu He Ala Ser 
755 760 765 
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Leu Ser Met Ser Ala Ser Ser Leu Leu Val Val Leu Asn Ser Leu Arg 
770 775 780 

Leu Lys Arg Ser * 
785 

(2) ANGABEN ZU SEQ ID NO: 35: 

( i ) S EQUENZ KENNZ E I CHEN : 

(A) LANGE: 2751 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT: 
(B) CLON(E) : HPS120 

(ix) MERKMAL: 

(A) NAME/ SCHLUSSEL : CDS 

(B) LAGE;1..2751 



(xi) SEQUENZBESCHREIBUNG : SEQ ID NO: 35: 

ATT AAA AAA TTA ATT CTA TCC TCT CTT GTT TTC GCA TGT ATC AAT ACC 48 
lie Lys Lys Leu lie Leu Ser Ser Leu Val Phe Ala Cys lie Asn Thr 
790 795 800 805 

AGC GTT GAA GCT TTA GAA AAT GAC GGC TCT AAA CCA AAC GAT TTG ACT 96 
Ser Val Glu Ala Leu Glu Asn Asp Gly Ser Lys Pro Asn Asp Leu Thr 
810 815 820 

TCT CCA AAA GAA GCC TCT CAA GAA TCT CAA AAA AAT GAA GCT CCA AAA 144 
Ser Pro Lys Glu Ala Ser Gin Glu Ser Gin Lys Asn Glu Ala Pro Lys 
825 830 835 

AAT GAA GTT CAA AGA AAT GAA GCT CAA AAA GAA ACC CCC CAA TCC AAT 192 
Asn Glu Val Gin Arg Asn Glu Ala Gin Lys Glu Thr Pro Gin Ser Asn 
840 845 850 

CAA ACG CCT AAA GAA ATG AAA GTC AAG TCC ATT TCT TAT GTC GGG CTT 24 0 

Gin Thr Pro Lys Glu Met Lys Val Lys Ser lie Ser Tyr Val Gly Leu 
855 860 865 

TCT TAC ATG TCT GAC ATG CTC GCT AAT GAA ATT GTA AAG ATT CGT GTG 288 
Ser Tyr Met Ser Asp Met Leu Ala Asn Glu lie Val Lys He Arg Val 
870 875 880 885 

GGC GAT ATT GTG GAT TCT AAA AAA ATA GAC ACC GCT GTT TTG GCT TTG 336 
Gly Asp He Val Asp Ser Lys Lys lie Asp Thr Ala Val Leu Ala Leu 
890 895 900 

TTC AAT CAA GGG TAT TTT AAA GAC GTT TAT GCC ACT TTT GAA GGC GGC 384 
Phe Asn Gin Gly Tyr Phe Lys Asp Val Tyr Ala Thr Phe Glu Gly Gly 
905 910 915 

ATA TTA GAG TTT CAT TTT GAT GAA AAA GCC AGG ATT GCC GGG GTA GAA 432 
He Leu Glu Phe His Phe Asp Glu Lys Ala Arg He Ala Gly Val Glu 
920 925 930 
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ATC AAG GGT TAT GGG ACT GAA AAG GAA AAA GAC GGC TTA AAA TCC CAA 480 
He Lys Gly Tyr Gly Thr Glu Lys Glu Lys Asp Gly Leu Lys Ser Gin 
935 940 945 

ATG GGG ATC AAA AAG GGC GAC ACC TTT GAT GAG CAA AAA TTA GAG CAT 528 
Met Gly He Lys Lys Gly Asp Thr Phe Asp Glu Gin Lys Leu Glu His 
950 955 960 965 

GCT AAA ACG GCT TTA AAA ACC GCT TTA GAG GGG CAG GGC TAT TAT GGG 576 
Ala Lys Thr Ala Leu Lys Thr Ala Leu Glu Gly Gin Gly Tyr Tyr Gly 
970 975 980 

AGC GTG GTG GAG GTG CGC ACA GAA AAG GTC AGT GAG GGT GCA TTA TTG 624 
Ser Val Val Glu Val Arg Thr Glu Lys Val Ser Glu Gly Ala Leu Leu 
985 990 995 

ATC GTG TTT GAT GTG AAT AGG GGG GAT AGC ATT TAT ATC AAA CAA TCC 672 
He Val Phe Asp Val Asn Arg Gly Asp Ser He Tyr He Lys Gin Ser 
1000 1005 1010 

ATT TAT GAG GGA AGC GCG AAA TTA AAA CGC CGC ATG ATT GAA TCT TTG 720 
He Tyr Glu Gly Ser Ala Lys Leu Lys Arg Arg Met He Glu Ser Leu 
1015 1020 1025 

AGT GCG AAC AAG CAA CGA GAT TTC ATG GGC TGG ATG TGG GGC TTG AAT 768 
Ser Ala Asn Lys Gin Arg Asp Phe Met Gly Trp Met Trp Gly Leu Asn 
1030 1035 1040 1045 

GAC GGG AAA TTG CGT TTA GAT CAA CTA GAA TAC GAT TCT ATG CGT ATC 816 
Asp Gly Lys Leu Arg Leu Asp Gin Leu Glu Tyr Asp Ser Met Arg He 
1050 1055 1060 

CAA GAT GTG TAT ATG CGT AGG GGT TAC TTA GAC GCT CAT ATT TCT TCG 864 
Gin Asp Val Tyr Met Arg Arg Gly Tyr Leu Asp Ala His He Ser Ser 
1065 1070 1075 

CCT TTT TTG AAA ACG GAT TTT TCT ACC CAT GAC GCT AAG CTT CAT TAT 912 
Pro Phe Leu Lys Thr Asp Phe Ser Thr His Asp Ala Lys Leu His Tyr 
1080 1085 1090 

AAA GTC AAA GAG GGG ATC CAA TAC AGG ATT TCA GAC ATT TTA ATA GAG 960 
Lys Val Lys Glu Gly He Gin Tyr Arg He Ser Asp He Leu He Glu 
1095 1100 1105 

ATT GAC AAC CCG GTA GTC CCC TTA AAA ACC TTA GAA AAA GCG CTT AAA 1008 
He Asp Asn Pro Val Val Pro Leu Lys Thr Leu Glu Lys Ala Leu Lys 
1110 1115 1120 1125 

GTG AAA AGG AAA GAT GTC TTT AAT ATT GAG CAT TTA AGA GCG GAT GCG 1056 
Val Lys Arg Lys Asp Val Phe Asn He Glu His Leu Arg Ala Asp Ala 
1130 1135 1140 

CAA ATT TTA AAA ACC GAA ATC GCC GAT AAG GGT TAT GCG TTT GCG GTG 1104 
Gin He Leu Lys Thr Glu He Ala Asp Lys Gly Tyr Ala Phe Ala Val 
1145 1150 1155 

GTG AAG CCA GAC TTG GAT AAA GAT GAA AAA AAC GGG CTT GTG AAA GTC 1152 
Val Lys Pro Asp Leu Asp Lys Asp Glu Lys Asn Gly Leu Val Lys Val 
1160 1165 1170 

ATT TAT CGT ATT GAA GTG GGC GAT ATG GTG TAT ATC AAT GAT GTC ATC 1200 
He Tyr Arg He Glu Val Gly Asp Met Val Tyr He Asn Asp Val He 
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1175 1180 1185 

ATT TCA GGG AAC CAG CGC ACG AGC GAT AGG ATC ATT AGA AGG GAG TTA 1248 
He Ser Gly Asn Gin Arg Thr Ser Asp Arg He He Arg Arg Glu Leu 
1190 1195 1200 1205 

TTG TTA GGG CCT AAG GAT AAA TAC AAC TTG ACC AAA CTG AGA AAT TCC 1296 
Leu Leu Gly Pro Lys Asp Lys Tyr Asn Leu Thr Lys Leu Arg Asn Ser 
1210 1215 1220 

GAA AAT TCT TTA AGG CGT TTA GGA TTC TTC TCT AAA GTC AAA ATT GAA 1344 
Glu Asn Ser Leu Arg Arg Leu Gly Phe Phe Ser Lys Val Lys He Glu 
1225 1230 1235 

GAA AAA AGG GTT AAT AGC TCA CTC ATG GAT TTA TTA GTG AGC GTA GAA 1392 
Glu Lys Arg Val Asn Ser Ser Leu Met Asp Leu Leu Val Ser Val Glu 
1240 1245 1250 

GAG GGG CGT ACT GGG CAG TTG CAA TTT GGG TTA GGC TAT GGC TCT TAT 1440 
Glu Gly Arg Thr Gly Gin Leu Gin Phe Gly Leu Gly Tyr Gly Ser Tyr 
1255 1260 1265 

GGA GGG CTT ATG CTT AAT GGG AGC GTG AGC GAA AGA AAC CTT TTT GGC 1488 
Gly Gly Leu Met Leu Asn Gly Ser Val Ser Glu Arg Asn Leu Phe Gly 
1270 1275 1280 1285 

ACA GGG CAA AGC ATG AGC TTG TAT GCT AAC ATC GCT ACA GGG GGG GGT 1536 
Thr Gly Gin Ser Met Ser Leu Tyr Ala Asn He Ala Thr Gly Gly Gly 
1290 1295 1300 

AGA TCT TAT CCG GGC ATG CCA AAA GGA GCG GGG CGT ATG TTT GCC GGG 1584 
Arg Ser Tyr Pro Gly Met Pro Lys Gly Ala Gly Arg Met Phe Ala Gly 
1305 1310 1315 

AAT TTG AGC TTG ACT AAT CCA AGG ATT TTT GAC AGC TGG TAT AGC TCT 1632 
Asn Leu Ser Leu Thr Asn Pro Arg He Phe Asp Ser Trp Tyr Ser Ser 
1320 1325 1330 

ACG ATC AAC CTT TAT GCG GAT TAC AGG ATA AGC TAC CAA TAC ATC CAA 1680 
Thr He Asn Leu Tyr Ala Asp Tyr Arg He Ser Tyr Gin Tyr He Gin 
1335 1340 1345 

CAA GGC GGG GGC TTT GGG GTG AAT GTC GGG CGC ATG CTG GGT AAT AGA 1728 
Gin Gly Gly Gly Phe Gly Val Asn Val Gly Arg Met Leu Gly Asn Arg 
1350 1355 1360 1365 

ACC CAT GTG AGC TTA GGG TAT AAC TTG AAT GTT ACC AAA CTC CTT GGT 1776 
Thr His Val Ser Leu Gly Tyr Asn Leu Asn Val Thr Lys Leu Leu Gly 
1370 1375 1380 

TTC AGC AGC CCT TTA TAC AAC CGC TAC TAT TCC TCT GTT AAT GAA GTG 1824 
Phe Ser Ser Pro Leu Tyr Asn Arg Tyr Tyr Ser Ser Val Asn Glu Val 
1385 1390 1395 

GTT TCT CCA AGG CAA TGT TCT ACC CCC GCA TCG GTG ATT ATC AAT CGC 1872 
Val Ser Pro Arg Gin Cys Ser Thr Pro Ala Ser Val He He Asn Arg 
1400 1405 1410 

TTA TCA GGC GGT AAA ACC CCC TTA CAA CCT GAA AGC TGT TCT AGT CCT 1920 
Leu Ser Gly Gly Lys Thr Pro Leu Gin Pro Glu Ser Cys Ser Ser Pro 
1415 1420 1425 
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GGA GCG ATC ACC ACT TCA CCA GAA ATA AGA GGT ATT TGG GAT AGG GAT 1968 
Gly Ala lie Thr Thr Ser Pro Glu lie Arg Gly lie Trp Asp Arg Asp 
1430 1435 1440 1445 

TAC CAT ACG CCT ATC ACC AGC TCT TTC ACC CTT GAT GTG AGC TAT GAC 2016 
Tyr His Thr Pro lie Thr Ser Ser Phe Thr Leu Asp Val Ser Tyr Asp 
1450 1455 1460 

AAC ACC GAT GAT TAT TAC TTC CCT AGA AAT GGG GTT ATC TTT AGT TCC 2064 
Asn Thr Asp Asp Tyr Tyr Phe Pro Arg Asn Gly Val He Phe Ser Ser 
1465 1470 1475 

TAT GCG ACG ATG TCT GGC TTG CCA AGC TCT GGC ACG CTC AAT TCT TGG 2112 
Tyr Ala Thr Met Ser Gly Leu Pro Ser Ser Gly Thr Leu Asn Ser Trp 
1480 1485 1490 

AAC GGG TTA GGC GGG AAT GTC CGT AAC ACC AAA GTT TAT GGT AAA TTC 2160 
Asn Gly Leu Gly Gly Asn Val Arg Asn Thr Lys Val Tyr Gly Lys Phe 
1495 1500 1505 

GCC GCT TAC CAC CAT TTG CAA AAA TAT TTA TTG ATA GAT TTG ATC GCT 2208 
Ala Ala Tyr His His Leu Gin Lys Tyr Leu Leu He Asp Leu He Ala 
1510 1515 1520 1525 

CGC TTT AAA ACG CAA GGA GGT TAT ATC TTT AGG TAT AAC ACC GAT GAT 2256 
Arg Phe Lys Thr Gin Gly Gly Tyr He Phe Arg Tyr Asn Thr Asp Asp 
1530 1535 1540 

TAC TTG CCC TTA AAC TCC ACC TTC TAC ATG GGG GGC GTA ACC ACG GTG 2304 
Tyr Leu Pro Leu Asn Ser Thr Phe Tyr Met Gly Gly Val Thr Thr Val 
1545 1550 1555 

AGA GGC TTT AGG AAC GGA TCG GTT ACT CCT AAA GAT GAG TTT GGC TTG 2352 
Arg Gly Phe Arg Asn Gly Ser Val Thr Pro Lys Asp Glu Phe Gly Leu 
1560 1565 1570 

TGG CTT GGA GGC GAT GGG ATT TTT ACC GCT TCT ACT GAA TTG AGC TAT 2400 
Trp Leu Gly Gly Asp Gly He Phe Thr Ala Ser Thr Glu Leu Ser Tyr 
1575 1580 1585 

GGG GTG CTA AAG GCG GCT AAA ATG CGC TTA GCG TGG TTT TTT GAC TTT 2448 
Gly Val Leu Lys Ala Ala Lys Met Arg Leu Ala Trp Phe Phe Asp Phe 
1590 1595 1600 1605 

GGT TTC TTA ACC TTT AAA ACC CCA ACT AGA GGG AGT TTT TTC TAT AAC 2496 
Gly Phe Leu Thr Phe Lys Thr Pro Thr Arg Gly Ser Phe Phe Tyr Asn 
1610 1615 1620 

GCT CCT GTT ACG ACA GCG AAT TTT AAA GAT TAT GGC GTT ATA GGG GCT 2544 
Ala Pro Val Thr Thr Ala Asn Phe Lys Asp Tyr Gly Val He Gly Ala 
1625 1630 1635 

GGG TTT GAA AGA GCG ACT TGG AGG GCT TCC ACA GGC TTG CAG ATT GAA 2592 
Gly Phe Glu Arg Ala Thr Trp Arg Ala Ser Thr Gly Leu Gin He Glu 
1640 1645 1650 

TGG ATT TCG CCC ATG GGG CCT TTG GTG TTG ATT TTC CCT ATA GCG TTT 2640 
Trp He Ser Pro Met Gly Pro Leu Val Leu He Phe Pro He Ala Phe 
1655 1660 1665 

TTC AAC CAA TGG GGC GAT GGC AAT GGC AAG AAA TGT AAA GGG CTA TGC 2688 
Phe Asn Gin Trp Gly Asp Gly Asn Gly Lys Lys Cys Lys Gly Leu Cys 
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1670 1675 1680 1685 

TTC AAC CCT AAC ATG GAC GAT TAC ACG CAA CAC TTT GAA TTT TCT ATG 2736 
Phe Asn Pro Asn Met Asp Asp Tyr Thr Gin His Phe Glu Phe Ser Met 
1690 1695 1700 

GGA ACA AGG TTT TAA 2751 
Gly Thr Arg Phe * 
1705 



(2) ANGABEN ZU SEQ ID NO: 36: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE : 917 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 36: 

lie Lys Lys Leu lie Leu Ser Ser Leu Val Phe Ala Cys lie Asn Thr 
15 10 15 

Ser Val Glu Ala Leu Glu Asn Asp Gly Ser Lys Pro Asn Asp Leu Thr 
20 25 30 

Ser Pro Lys Glu Ala Ser Gin Glu Ser Gin Lys Asn Glu Ala Pro Lys 
35 40 45 

Asn Glu Val Gin Arg Asn Glu Ala Gin Lys Glu Thr Pro Gin Ser Asn 
50 55 60 

Gin Thr Pro Lys Glu Met Lys Val Lys Ser lie Ser Tyr Val Gly Leu 
65 70 75 80 

Ser Tyr Met Ser Asp Met Leu Ala Asn Glu lie Val Lys lie Arg Val 
85 90 95 

Gly Asp lie Val Asp Ser Lys Lys lie Asp Thr Ala Val Leu Ala Leu 
100 105 110 

Phe Asn Gin Gly Tyr Phe Lys Asp Val Tyr Ala Thr Phe Glu Gly Gly 
115 120 125 

He Leu Glu Phe His Phe Asp Glu Lys Ala Arg He Ala Gly Val Glu 
130 .135 140 

He Lys Gly Tyr Gly Thr Glu Lys Glu Lys Asp Gly Leu Lys Ser Gin 
145 150 155 160 

Met Gly He Lys Lys Gly Asp Thr Phe Asp Glu Gin Lys Leu Glu His 
165 170 175 

Ala Lys Thr Ala Leu Lys Thr Ala Leu Glu Gly Gin Gly Tyr Tyr Gly 
180 185 190 

Ser Val Val Glu Val Arg Thr Glu Lys Val Ser Glu Gly Ala Leu Leu 
195 200 205 

He Val Phe Asp Val Asn Arg Gly Asp Ser He Tyr He Lys Gin Ser 
210 215 220 
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lie Tyr Glu Gly Ser Ala Lys Leu Lys Arg Arg Met lie Glu Ser Leu 
225 230 235 240 

Ser Ala Asn Lys Gin Arg Asp Phe Met Gly Trp Met Trp Gly Leu Asn 
245 250 255 

Asp Gly Lys Leu Arg Leu Asp Gin Leu Glu Tyr Asp Ser Met Arg lie 
260 265 270 

Gin Asp Val Tyr Met Arg Arg Gly Tyr Leu Asp Ala His lie Ser Ser 
275 280 285 

Pro Phe Leu Lys Thr Asp Phe Ser Thr His Asp Ala Lys Leu His Tyr 
290 295 300 

Lvs Val Lys Glu Gly He Gin Tyr Arg He Ser Asp He Leu He Glu 
305 310 315 320 

He Asp Asn Pro Val Val Pro Leu Lys Thr Leu Glu Lys Ala Leu Lys 
325 330 335 

Val Lys Arg Lys Asp Val Phe Asn He Glu His Leu Arg Ala Asp Ala 
340 345 350 

Gin He Leu Lys Thr Glu He Ala Asp Lys Gly Tyr Ala Phe Ala Val 
355 360 365 

Val Lys Pro Asp Leu Asp Lys Asp Glu Lys Asn Gly Leu Val Lys Val 
370 375 380 

He Tyr Arg He Glu Val Gly Asp Met Val Tyr He Asn Asp Val He 
385 390 395 400 

He Ser Gly Asn Gin Arg Thr Ser Asp Arg He He Arg Arg Glu Leu 
405 410 415 

Leu Leu Gly Pro Lys Asp Lys Tyr Asn Leu Thr Lys Leu Arg Asn Ser 
420 425 430 

Glu Asn Ser Leu Arg Arg Leu Gly Phe Phe Ser Lys Val Lys He Glu 
435 440 445 

Glu Lys Arg Val Asn Ser Ser Leu Met Asp Leu Leu Val Ser Val Glu 
450 455 460 

Glu Gly Arg Thr Gly Gin Leu Gin Phe Gly Leu Gly Tyr Gly Ser Tyr 
46S 470 475 480 

Gly Gly Leu Met Leu Asn Gly Ser Val Ser Glu Arg Asn Leu Phe Gly 
485 490 495 

Thr Gly Gin Ser Met Ser Leu Tyr Ala Asn He Ala Thr Gly Gly Gly 
500 505 510 

Arg Ser Tyr Pro Gly Met Pro Lys Gly Ala Gly Arg Met Phe Ala Gly 
515 520 525 

Asn Leu Ser Leu Thr Asn Pro Arg He Phe Asp Ser Trp Tyr Ser Ser 
530 535 540 

Thr He Asn Leu Tyr Ala Asp Tyr Arg He Ser Tyr Gin Tyr He Gin 
545 550 555 560 
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Gin Glv Gly Gly Phe Gly Val Asn Val Gly Arg Met Leu Gly Asn Arg 
565 570 575 

Thr His Val Ser Leu Gly Tyr Asn Leu Asn Val Thr Lys Leu Leu Gly 
580 585 590 

Phe Ser Ser Pro Leu Tyr Asn Arg Tyr Tyr Ser Ser Val Asn Glu Val 
595 600 605 

Val Ser Pro Arg Gin Cys Ser Thr Pro Ala Ser Val lie lie Asn Arg 
610 615 620 

Leu Ser Gly Gly Lys Thr Pro Leu Gin Pro Glu Ser Cys Ser Ser Pro 
625 630 635 640 

Gly Ala lie Thr Thr Ser Pro Glu lie Arg Gly lie Trp Asp Arg Asp 
645 650 655 

Tyr His Thr Pro lie Thr Ser Ser Phe Thr Leu Asp Val Ser Tyr Asp 
660 665 670 

Asn Thr Asp Asp Tyr Tyr Phe Pro Arg Asn Gly Val He Phe Ser Ser 
675 680 685 

Tyr Ala Thr Met Ser Gly Leu Pro Ser Ser Gly Thr Leu Asn Ser Trp 
690 695 700 

Asn Gly Leu Gly Gly Asn Val Arg Asn Thr Lys Val Tyr Gly Lys Phe 
705 710 715 720 

Ala Ala Tyr His His Leu Gin Lys Tyr Leu Leu He Asp Leu He Ala 
725 730 735 

Arg Phe Lys Thr Gin Gly Gly Tyr lie Phe Arg Tyr Asn Thr Asp Asp 
740 745 750 

Tyr Leu Pro Leu Asn Ser Thr Phe Tyr Met Gly Gly Val Thr Thr Val 
755 760 765 

Arg Gly Phe Arg Asn Gly Ser Val Thr Pro Lys Asp Glu Phe Gly Leu 
770 775 780 

Trp Leu Gly Gly Asp Gly He Phe Thr Ala Ser Thr Glu Leu Ser Tyr 
785 790 795 800 

Gly Val Leu Lys Ala Ala Lys Met Arg Leu Ala Trp Phe Phe Asp Phe 
805 810 815 

Gly Phe Leu Thr Phe Lys Thr Pro Thr Arg Gly Ser Phe Phe Tyr Asn 
820 825 830 

Ala Pro Val Thr Thr Ala Asn Phe Lys Asp Tyr Gly Val He Gly Ala 
835 840 845 

Gly Phe Glu Arg Ala Thr Trp Arg Ala Ser Thr Gly Leu Gin He Glu 
850 855 860 

Trp He Ser Pro Met Gly Pro Leu Val Leu He Phe Pro He Ala Phe 
865 870 875 880 

Phe Asn Gin Trp Gly Asp Gly Asn Gly Lys Lys Cys Lys Gly Leu Cys 
885 890 895 
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Phe Asn Pro Asn Met Asp Asp Tyr Thr Gin His Phe Glu Phe Ser Met 
900 905 910 

Gly Thr Arg Phe * 
915 

(2) ANGABEN ZU SEQ ID NO: 37: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 990 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT : 
(B) CLON(E) : HPS130 

(ix) MERKMAL: 

(A) NAME/ SCHLUSSEL : CDS 

(B) LAGE:1..990 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 37: 

ATG AAA AGA TTT GTT TTG TTT TTA TTG TTC ATG TGC GTT TGC GTT CAA 48 
Met Lys Arg Phe Val Leu Phe Leu Leu Phe Met Cys Val Cys Val Gin 
920 925 930 

GCT TAC GCC GAG CAA GAT TAG TTT TTT AGG GAT TTT AAA TCT AGA GAT 96 
Ala Tyr Ala Glu Gin Asp Tyr Phe Phe Arg Asp Phe Lys Ser Arg Asp 
935 940 945 

TTG CCC CAA AAA CTC CAT CTT GAT AAA AAG CTC TCC CAA ACA ATA CAG 144 
Leu Pro Gin Lys Leu His Leu Asp Lys Lys Leu Ser Gin Thr lie Gin 
950 955 960 965 

CCA TGC ATG CAA CTT AAC GCA TCA AAA CAC TAC ACT TCT ACC GGG GTT 192 
Pro Cys Met Gin Leu Asn Ala Ser Lys His Tyr Thr Ser Thr Gly Val 
970 975 980 

AGA GAG CCT GAT AAA TGC ACA AAG AGT TTT AAA AAA TCC GCT CTC ATG 240 
Arg Glu Pro Asp Lys Cys Thr Lys Ser Phe Lys Lys Ser Ala Leu Met 
985 990 995 

TCC TAT GAC TTA GCG CTA GGT TAT TTG GTG AGT AAG AAT AAG CAA TAC 288 
Ser Tyr Asp Leu Ala Leu Gly Tyr Leu Val Ser Lys Asn Lys Gin Tyr 
1000 1005 1010 

GGC TTA AAG GCT ATA GAA ATT TTA AAC GCT TGG GCT AAA GAG CTT CAA 336 
Gly Leu Lys Ala lie Glu lie Leu Asn Ala Trp Ala Lys Glu Leu Gin 
1015 1020 1025 

AGC GTG GAT ACT TAT CAG AGC GAG GAT AAT ATC AAT TTT TAC ATG CCT 384 
Ser Val Asp Thr Tyr Gin Ser Glu Asp Asn lie Asn Phe Tyr Met Pro 
1030 1035 1040 1045 

TAT ATG AAC ATG GCT TAT TGG TTT GTC AAA AAG GCG TTT CCT AGC CCA 432 
Tyr Met Asn Met Ala Tyr Trp Phe Val Lys Lys Ala Phe Pro Ser Pro 
1050 1055 1060 
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GAA TAT GAA GAT TTC ATT AAG CGG ATG CGC CAG TAT TCT CAA TCA GCT 480 
Glu Tyr Glu Asp Phe lie Lys Arg Met Arg Gin Tyr Ser Gin Ser Ala 
1065 1070 1075 

CTT AAC ACT AAC CAT GGG GCG TGG GGC ATT CTT TTT GAT GTG AGT TCT 528 
Leu Asn Thr Asn His Gly Ala Txp Gly lie Leu Phe Asp Val Ser Ser 
1080 1085 1090 

GCG CTA GCG TTA GAC GAT AAT GCC CTT TTG CAC AAT AGC GCT AAT CGG 576 
Ala Leu Ala Leu Asp Asp Asn Ala Leu Leu His Asn Ser Ala Asn Arg 
1095 1100 1105 

TGG CAG GAG TGG GTG TTT AAA GCC ATA GAT GAG AAT GGG GTT ATT GCT 624 
Trp Gin Glu Trp Val Phe Lys Ala lie Asp Glu Asn Gly Val lie Ala 
1110 1115 1120 1125 

AGC GCG ATC ACT AGG AGC GAT ACG AGC GAT TAT CAT GGC GGC CCT ACA 672 
Ser Ala He Thr Arg Ser Asp Thr Ser Asp Tyr His Gly Gly Pro Thr 
1130 1135 1140 

AAG GGC ATT AAG GGG ATA GCT TAT ACC AAT TTC GCG CTT CTT GCG CTA 720 
Lys Gly He Lys Gly He Ala Tyr Thr Asn Phe Ala Leu Leu Ala Leu 
1145 1150 1155 

ACC ATA TCA GGC GAA TTG CTT TTT GAG AAC GGG TAT GAT TTG TGG GGT 768 
Thr He Ser Gly Glu Leu Leu Phe Glu Asn Gly Tyr Asp Leu Trp Gly 
1160 1165 1170 

AGT GGA GCT GGG AAA AGG CTC TCT GTG GCG TAT AAC AAA GTT GCA ACA 816 
Ser Gly Ala Gly Lys Arg Leu Ser Val Ala Tyr Asn Lys Val Ala Thr 
1175 1180 1185 

TGG ATT TTA AAC CCT GAA ACT TTC CCT TAT TTC CAG CCT AAC CTT ATC 864 
Trp He Leu Asn Pro Glu Thr Phe Pro Tyr Phe Gin Pro Asn Leu He 
1190 1195 1200 1205 . 

GGG GTG CAT AAC AAC GCC TAT TTC ATT ATT TTA GCC AAG CAT TAT TCT 912 
Gly Val His Asn Asn Ala Tyr Phe He He Leu Ala Lys His Tyr Ser 
1210 1215 1220 

AGC CCT AGT GCA AAT GAG CTT TTA AAG CAA GGC GAT TTA CAC GAA GAT 960 
Ser Pro Ser Ala Asn Glu Leu Leu Lys Gin Gly Asp Leu His Glu Asp 
1225 1230 1235 

GGT TTC AGG CTG AAA CTC CGA TCG CCA TGA 990 
Gly Phe Arg Leu Lys Leu Arg Ser Pro * 
1240 1245 



(2) ANGABEN ZU SEQ ID NO: 38: 

{ i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 330 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 38: 



Met Lys Arg Phe Val Leu Phe Leu Leu Phe Met Cys Val Cys Val Gin 
15 10 15 
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Ala Tyr Ala Glu Gin Asp Tyr Phe Phe Arg Asp Phe Lys Ser Arg Asp 
20 25 30 

Leu Pro Gin Lys Leu His Leu Asp Lys Lys Leu Ser Gin Thr lie Gin 
35 40 45 

Pro Cys Met Gin Leu Asn Ala Ser Lys His Tyr Thr Ser Thr Gly Val 
50 55 60 

Arg Glu Pro Asp Lys Cys Thr Lys Ser Phe Lys Lys Ser Ala Leu Met 
65 70 75 80 

Ser Tyr Asp Leu Ala Leu Gly Tyr Leu Val Ser Lys Asn Lys Gin Tyr 
85 90 95 

Gly Leu Lys Ala lie Glu lie Leu Asn Ala Trp Ala Lys Glu Leu Gin 
100 105 110 

Ser Val Asp Thr Tyr Gin Ser Glu Asp Asn lie Asn Phe Tyr Met Pro 
115 120 125 

Tyr Met Asn Met Ala Tyr Trp Phe Val Lys Lys Ala Phe Pro Ser Pro 
130 135 140 

Glu Tyr Glu Asp Phe lie Lys Arg Met Arg Gin Tyr Ser Gin Ser Ala 
145 150 155 160 

Leu Asn Thr Asn His Gly Ala Trp Gly He Leu Phe Asp Val Ser Ser 
165 170 175 

Ala Leu Ala Leu Asp Asp Asn Ala Leu Leu His Asn Ser Ala Asn Arg 
180 185 190 

Trp Gin Glu Trp Val Phe Lys Ala He Asp Glu Asn Gly Val He Ala 
195 200 205 

Ser Ala He Thr Arg Ser Asp Thr Ser Asp Tyr His Gly Gly Pro Thr 
210 215 220 

Lys Gly He Lys Gly He Ala Tyr Thr Asn Phe Ala Leu Leu Ala Leu 
225 230 235 240 

Thr He Ser Gly Glu Leu Leu Phe Glu Asn Gly Tyr Asp Leu Trp Gly 
245 250 255 

Ser Gly Ala Gly Lys Arg Leu Ser Val Ala Tyr Asn Lys Val Ala Thr 
260 265 270 

Trp He Leu Asn Pro Glu Thr Phe Pro Tyr Phe Gin Pro Asn Leu He 
275 280 285 

Gly Val His Asn Asn Ala Tyr Phe He He Leu Ala Lys His Tyr Ser 
290 295 300 

Ser Pro Ser Ala Asn Glu Leu Leu Lys Gin Gly Asp Leu His Glu Asp 
305 310 315 320 

Gly Phe Arg Leu Lys Leu Arg Ser Pro * 
325 330 

(2) ANGABEN ZU SEQ ID NO: 39: 
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( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 1482 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: be ides 

(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT : 
(B) CLON(E) : HPS133 

(ix) MERKMAL: 

(A) NAME / S CHLUS SEL : CDS 

(B) LAGE:1. .1482 



(xi) SEQUEN2BESCHREIBUNG : SEQ ID NO : 39: 

ATG CAA AGT CTT AGT TGG CTG AAT TTA GCG TTT CGT TGG CTC TTT ATA 48 
Met Gin Ser Leu Ser Trp Leu Asn Leu Ala Phe Arg Trp Leu Phe He 
335 340 345 

ACA GGG CTT GGC TAT TAT ATA ATG ACT TTA TTG CAA TGG TAT CAT TAC 96 
Thr Gly Leu Gly Tyr Tyr He Met Thr Leu Leu Gin Trp Tyr His Tyr 
350 355 360 

AGC GTG TTT AGG ATC TTA ACC AAG CAC CAC AAA ATG CGT TGG CAT GGG 144 
Ser Val Phe Arg He Leu Thr Lys His His Lys Met Arg Trp His Gly 
365 370 375 

ATT TAT TTT TTA TTG CCT TTA GGG GTG TTT ATT CTG TCG TAT GCT TTC 192 
He Tyr Phe Leu Leu Pro Leu Gly Val Phe He Leu Ser Tyr Ala Phe 
^80 385 390 

ACA ATG CCG TTT GTT TTT GAT TTC TTT TGC GGC GTT ATT CAA ATG CCC 240 
Thr Met Pro Phe Val Phe Asp Phe Phe Cys Gly Val He Gin Met Pro 
395 400 405 410 

ATG CTC ATT GTT TGG GCC AAA CGC AAC GAC AAG CCT TTA GTT TTC ACG 288 
Met Leu He Val Trp Ala Lys Arg Asn Asp Lys Pro Leu Val Phe Thr 
415 420 425 

CCA AGG GTG AAG CGC TTT TTT ATC TTC TTA TTA TTA TTT TTA ATC TTG 336 
Pro Arg Val Lys Arg Phe Phe He Phe Leu Leu Leu Phe Leu He Leu 
430 435 440 

CAT GAA ATC TTA AAT ATA GAA TTA GTC CCT TTG GAT GGG ATT TCG CTC 384 
His Glu He Leu Asn He Glu Leu Val Pro Leu Asp Gly He Ser Leu 
445 450 455 

GCG CTA GGC TAT TTG TGT TTG TTT ATA TTC GTT TTA AGC GCT TCT TTA 4 32 

Ala Leu Gly Tyr Leu Cys Leu Phe He Phe Val Leu Ser Ala Ser Leu 
460 465 470 

ATC TCT GAA AAA GCC TTA TCC AAG CAG TAT TTG CAA ACC GCT AAA GAT 480 
He Ser Glu Lys Ala Leu Ser Lys Gin Tyr Leu Gin Thr Ala Lys Asp 
475 480 485 490 

AAA ATC ACC TCT TTA AAG AAT TTA AAA GTC ATC GCC ATT ACC GGA AGC 528 
Lys He Thr Ser Leu Lys Asn Leu Lys Val He Ala He Thr Gly Ser 
495 500 505 
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TTT GGG AAA ACC AGC ACC AAA AAT TTC TTG CTT CAA ATC TTA CAA ACC 576 
Phe Gly Lys Thr Ser Thr Lys Asn Phe Leu Leu Gin He Leu Gin Thr 
510 515 520 

ACA TTC AAC GCG CAT GCA AGC CCC AAA AGC GTC AAT ACC CTT TTA GGG 624 
Thr Phe Asn Ala His Ala Ser Pro Lys Ser Val Asn Thr Leu Leu Gly 
525 530 535 

CTT GCG AAT GAT ATT AAT CAG AAT TTA GAC GAT AGG AGT GAA ATC TAT 672 
Leu Ala Asn Asp He Asn Gin Asn Leu Asp Asp Arg Ser Glu He Tyr 
540 545 550 

ATC GCT GAA GCC GGG GCA AGG AAT AAG GGC GAT ATT AAA GAA ATC ACC 720 
He Ala Glu Ala Gly Ala Arg Asn Lys Gly Asp He Lys Glu He Thr 
555 560 565 570 

TGT CTC ATT GAA CCG CAC CTT GTT GTG GTT GCA GAA GTG GGC GAA CAG 768 
Cys Leu He Glu Pro His Leu Val Val Val Ala Glu Val Gly Glu Gin 
575 580 585 

CAT TTA GAA TAC TTT AAA ACT TTA GAA AAT ATT TGC GAG ACT AAA GCG 816 
His Leu Glu Tyr Phe Lys Thr Leu Glu Asn He Cys Glu Thr Lys Ala 
590 595 600 

GAA TTA TTG GAT TCC AAA CGC TTA GAA AAA GCC TTT TGT TAC TCG GTG 864 
Glu Leu Leu Asp Ser Lys Arg Leu Glu Lys Ala Phe Cys Tyr Ser Val 
605 610 615 

GAA AAG ATC AAG CCC TAT GCC CCT AAA GAT AGC CCT TTA ATA GAC TAT 912 
Glu Lys He Lys Pro Tyr Ala Pro Lys Asp Ser Pro Leu He Asp Tyr 
620 625 630 

TCT AGC CTG GTT AAA AAC ATC CAA TCC ACT TTA AAA GGC ACT TCT TTT 960 
Ser Ser Leu Val Lys Asn He Gin Ser Thr Leu Lys Gly Thr Ser Phe 

640 645 650 



635 



1008 



GAA ATG CTT ATA GGT AGC GTT TGG GAA AGA TTT GAA ACA AAG GTT CTA 
Glu Met Leu He Gly Ser Val Trp Glu Arg Phe Glu Thr Lys Val Leu 
655 660 665 

GGG GAG TTT AGC GCT TAT AAT ATC GCT TCA GCC ATT TTA ATC GCT AAG 1056 
Gly Glu Phe Ser Ala Tyr Asn He Ala Ser Ala He Leu He Ala Lys 
670 675 680 

CAT TTA GGC TTA GAG ACC GAA AGG ATC AAA CGG CTT GTT TTA GAA CTC 1104 
His Leu Gly Leu Glu Thr Glu Arg He Lys Arg Leu Val Leu Glu Leu 
685 690 695 

AAC CCT ATT GCT CAT CGT TTG CAA CTT TTG GAA GTG AAT CAA AAA ATC 1152 
Asn Pro He Ala His Arg Leu Gin Leu Leu Glu Val Asn Gin Lys He 
700 705 710 

ATC ATA GAC GAT AGC TTT AAT GGG AAT TTA AAG GGC ATG TTA GAG GGC 1200 
He He Asp Asp Ser Phe Asn Gly Asn Leu Lys Gly Met Leu Glu Gly 
715 720 725 730 

ATT CGT TTA GCG AGT TTG CAC AAA GGG CGT AAA GTC ATT GTA ACA CCG 1248 
He Arg Leu Ala Ser Leu His Lys Gly Arg Lys Val He Val Thr Pro 
735 740 745 

GGC TTA GTG GAA AGC AAT ACA GAA AGT AAT GAG GCT TTA GCG CAA AAA 1296 
Gly Leu Val Glu Ser Asn Thr Glu Ser Asn Glu Ala Leu Ala Gin Lys 
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1482 



750 755 760 

ATA GAC GGG GTT TTT GAT GTC GCT ATC ATC ACA GGG GAG TTG AAT TCC 1344 
lie Asp Gly Val Phe Asp Val Ala lie He Thr Gly Glu Leu Asn Ser 
765 770 775 

AAA ACG ATT GCT TCA CAA TTG AAA ACC CCC CAA AAA ATC TTA CTC AAG 1392 
Lys Thr He Ala Ser Gin Leu Lys Thr Pro Gin Lys He Leu Leu Lys 
780 785 790 

GAT AAG GCG CAA TTG GAA AAT ATC TTA CAA GCC ACC ACG ATT CAA GGC 1440 
Asp Lys Ala Gin Leu Glu Asn He Leu Gin Ala Thr Thr He Gin Gly 
795 800 805 810 

GAT TTG ATT TTA TTC GCT AAT GAC GCC CCT AAT TAC ATT TAG 
Asp Leu He Leu Phe Ala Asn Asp Ala Pro Asn Tyr He * 
815 820 

(2) ANGABEN ZU SEQ ID NO: 40: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 494 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 
(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 40: 

Met Gin Ser Leu Ser Trp Leu Asn Leu Ala Phe Arg Trp Leu Phe He 
15 10 15 

Thr Gly Leu Gly Tyr Tyr He Met Thr Leu Leu Gin Trp Tyr His Tyr 
20 25 30 

Ser Val Phe Arg He Leu Thr Lys His His Lys Met Arg Trp His Gly 
35 40 45 

He Tyr Phe Leu Leu Pro Leu Gly Val Phe He Leu Ser Tyr Ala Phe 
50 55 60 

Thr Met Pro Phe Val Phe Asp Phe Phe Cys Gly Val He Gin Met Pro 
65 70 75 80 

Met Leu He Val Trp Ala Lys Arg Asn Asp Lys Pro Leu Val Phe Thr 

85 90 95 

Pro Arg Val Lys Arg Phe "Phe He Phe Leu Leu Leu Phe Leu He Leu 
100 105 HO 

His Glu He Leu Asn He Glu Leu Val Pro Leu Asp Gly He Ser Leu 
115 120 125 

Ala Leu Gly Tyr Leu Cys Leu Phe He Phe Val Leu Ser Ala Ser Leu 
130 135 140 

He Ser Glu Lys Ala Leu Ser Lys Gin Tyr Leu Gin Thr Ala Lys Asp 
145 150 155 160 

Lys He Thr Ser Leu Lys Asn Leu Lys Val He Ala He Thr Gly Ser 
165 170 175 
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Phe Gly Lys Thr Ser Thr Lys Asn Phe Leu Leu Gin lie Leu Gin Thr 
180 185 190 

Thr Phe Asn Ala His Ala Ser Pro Lys Ser Val Asn Thr Leu Leu Gly 
195 200 205 

Leu Ala Asn Asp He Asn Gin Asn Leu Asp Asp Arg Ser Glu He Tyr 
210 215 220 

He Ala Glu Ala Gly Ala Arg Asn Lys Gly Asp He Lys Glu He Thr 
225 230 235 240 

Cys Leu He Glu Pro His Leu Val Val Val Ala Glu Val Gly Glu Gin 
245 250 255 

His Leu Glu Tyr Phe Lys Thr Leu Glu Asn He Cys Glu Thr Lys Ala 
260 265 270 

Glu Leu Leu Asp Ser Lys Arg Leu Glu Lys Ala Phe Cys Tyr Ser Val 
275 280 285 

Glu Lys He Lys Pro Tyr Ala Pro Lys Asp Ser Pro Leu He Asp Tyr 
290 295 300 

Ser Ser Leu Val Lys Asn He Gin Ser Thr Leu Lys Gly Thr Ser Phe 
305 310 315 320 

Glu Met Leu He Gly Ser Val Trp Glu Arg Phe Glu Thr Lys Val Leu 
325 330 335 

Glv Glu Phe Ser Ala Tyr Asn He Ala Ser Ala He Leu He Ala Lys 
340 345 350 

His Leu Gly Leu Glu Thr Glu Arg He Lys Arg Leu Val Leu Glu Leu 
355 360 365 

Asn Pro He Ala His Arg Leu Gin Leu Leu Glu Val Asn Gin Lys He 
370 375 380 

He He Asp Asp Ser Phe Asn Gly Asn Leu Lys Gly Met Leu Glu Gly 
385 390 395 400 

He Arg Leu Ala Ser Leu His Lys Gly Arg Lys Val He Val Thr Pro 
405 410 415 

Glv Leu Val Glu Ser Asn Thr Glu Ser Asn Glu Ala Leu Ala Gin Lys 
420 425 430 

He Asp Gly Val Phe Asp Val Ala He He Thr Gly Glu Leu Asn Ser 
435 440 445 

Lys Thr He Ala Ser Gin Leu Lys Thr Pro Gin Lys He Leu Leu Lys 
450 455 460 

Asp Lys Ala Gin Leu Glu Asn He Leu Gin Ala Thr Thr He Gin Gly 
465 470 475 480 

Asp Leu He Leu Phe Ala Asn Asp Ala Pro Asn Tyr He * 
485 490 

(2) ANGABEN ZU SEQ ID NO: 41: 
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( i ) SEQUENZKENNZE I CHEN : 

(A) LANGE: 600 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT: 
(B) CLON(E) : HPC134 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL : CDS 

(B) LAGE:1. -600 



(Xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 41: 

ATG TCA AGC GCT CTG TTA GGC TTA CAA ATT GTT TTA GCG GTA TTG ATT 48 
Met Ser Ser Ala Leu Leu Gly Leu Gin lie Val Leu Ala Val Leu lie 
495 500 505 510 

GTG GTG GTG GTT TTG TTG CAA AAA AGT TCT AGC ATC GGC TTA GGG ACT 96 
Val Val Val Val Leu Leu Gin Lys Ser Ser Ser He Gly Leu Gly Tnr 
515 520 525 

TAT AGC GGG AGT AAT GAG TCT TTA TTT GGC GCT AAA GGG CCC GCG TGC 144 
Tyr Ser Gly Ser Asn Glu Ser Leu Phe Gly Ala Lys Gly Pro Ala Cys 
530 535 540 

TTT ATG GCG AAA TTG ACC ATG TTT TTA GGG CTG TTA TTT GTT ATC AAC 192 
Phe Met Ala Lys Leu Thr Met Phe Leu Gly Leu Leu Phe Val He Asn 
545 550 555 

ACC ATC GCT TTG GGC TAT TTT TAC AAC AAA GAA TAC GGC AAA AGC ATT 240 
Thr He Ala Leu Gly Tyr Phe Tyr Asn Lys Glu Tyr Gly Lys Ser lie 
560 565 570 

TTA GAT GAA ACT AAA ACC AAC AAA GAG CTT TCG CCC TTA GTC CCT GCC 288 
Leu Asp Glu Thr Lys Thr Asn Lys Glu Leu Ser Pro Leu Val Pro Ala 
575 580 585 590 

ACC GGC ACG CTC AAC CCT ACA CTC AAT CCC ACG CTC AAC CCT ACG CTC 336 
Thr Gly Thr Leu Asn Pro Thr Leu Asn Pro Thr Leu Asn Pro Tnr Leu 
595 600 605 

AAC CCT TTA GAG CAA GCC CCA ACT AAT CCT TTA ATG CCA AAA CAA ACG 384 
Asn Pro Leu Glu Gin Ala "Pro Thr Asn Pro Leu Met Pro Lys Gin Tnr 
610 615 620 

CCT AAC GAA CTC CCT AAA GAG CCA GCC AAA GCG CCT TCT GTT GAA AGC 432 
Pro Asn Glu Leu Pro Lys Glu Pro Ala Lys Ala Pro Ser Val Glu Ser 
625 630 635 

CCC AAA CAG AAT GAA AAA AAT GAA AAA AAT GAC GCC AAA GAG AAT GGT 480 
Pro Lys Gin Asn Glu Lys Asn Glu Lys Asn Asp Ala Lys Glu Asn Gly 
640 645 650 

ATA AAG GGT GTT GAA AAA ACT AAA GAG AAC GCC AAA ACG CCC CCA ACC 528 
He Lys Gly Val Glu Lys Thr Lys Glu Asn Ala Lys Thr Pro Pro Thr 
655 660 665 670 
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ACC CAC CAA AAG CCT AAA ACG CAT GCG ACA CAA ACC AAC GCC CAT ACC 576 
Thr His Gin Lys Pro Lys Thr His Ala Thx Gin Thr Asn Ala His Thr 
675 680 685 

AAC CAA AAA AAG GAT GAA AAA TAA 600 
Asn Gin Lys Lys Asp Glu Lys * 
690 



(2) ANGABEN ZU SEQ ID NO: 42: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 200 Amino saur en 

(B) ART: Aminosaure 
(D) TOPOLOGIE : linear 

(ii) ART DES MOLEKXJLS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 42: 

Met Ser Ser Ala Leu Leu Gly Leu Gin lie Val Leu Ala Val Leu He 
15 10 15 

Val Val Val Val Leu Leu Gin Lys Ser Ser Ser He Gly Leu Gly Thr 
20 25 30 

Tyr Ser Gly Ser Asn Glu Ser Leu Phe Gly Ala Lys Gly Pro Ala Cys 
35 40 45 

Phe Met Ala Lys Leu Thr Met Phe Leu Gly Leu Leu Phe Val He Asn 
50 55 60 

Thr He Ala Leu Gly Tyr Phe Tyr Asn Lys Glu Tyr Gly Lys Ser He 
65 70 75 80 

Leu Asp Glu Thr Lys Thr Asn Lys Glu Leu Ser Pro Leu Val Pro Ala 
85 90 95 

Thr Gly Thr Leu Asn Pro Thr Leu Asn Pro Thr Leu Asn Pro Thr Leu 
100 105 110 

Asn Pro Leu Glu Gin Ala Pro Thr Asn Pro Leu Met Pro Lys Gin Thr 
115 120 125 

Pro Asn Glu Leu Pro Lys Glu Pro Ala Lys Ala Pro Ser Val Glu Ser 
130 135 140 

Pro Lys Gin Asn Glu Lys Asn Glu Lys Asn Asp Ala Lys Glu Asn Gly 
145 150 155 160 

He Lys Gly Val Glu Lys Thr Lys Glu Asn Ala Lys Thr Pro Pro Thr 
165 170 175 

Thr His Gin Lys Pro Lys Thr His Ala Thr Gin Thr Asn Ala His Thr 
180 185 190 

Asn Gin Lys Lys Asp Glu Lys * 
195 200 

(2) ANGABEN ZU SEQ ID NO: 43: 

(i) SEQUENZKENNZEICHEN : 

(A) LANGE: 1536 Basenpaare 
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(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT : 
(B) CLON(E) : HPS143 

( ix) MERKMAL : 

(A) NAME/SCHLUSSEL : CDS 

(B) LAGE : 1 . • 1536 



315 



48 



144 



192 



<xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 43: 

ATG AAA AAA CTT CTT TAT ACC ATA CTC GCG CTT CTT TTA ATC GGC CTT 
Met Lys Lys Leu Leu Tyr Thr He Leu Ala Leu Leu Leu He Gly Leu 
205 210 215 

TTA ACA ATC TAT CTC ATC CTT TTT ACA GAA TGG GGG AAT AAG ATC ATC 96 
Leu Thr* lie Tyr Leu He Leu Phe Thr Glu Trp Gly Asn Lys He He 
220 225 230 

GCT TCG TAT ATA GAG AAA AAA ATC AAC CCG AAC GAG CAC TAC TTG AGC 
Ala Ser "fyr lie Glu Lys Lys He Asn Pro Asn Glu His Tyr Leu Ser 
235 240 245 

GTT AAA ACC TTT AAA TTG AGA TTC AAC TCT TTG GAT TTT AAA GCT CAA 
Sal Lys ThS Phe Lys Leu Arg Phe Asn Ser Leu Asp Phe Lys Ala Gin 
250 255 260 

GCC AAC GAT GAT TCC ACG CTC ATT CTT AAG GGG GAT TTT TCA CTT TTA 240 
Ala Asn Asp Asp Ser Thr Leu He Leu Lys Gly Asp Phe Ser Leu Leu 
265 270 275 280 

AAG CAA AGC GTA AAT TTG AAT TAC CAT ATA GAT ATT AAA GAT TTA CGC 288 
Lys Gin Ser Val Asn Leu Asn Tyr His He Asp He Lys Asp Leu Arg 
285 290 295 

TCT TTC AAA GAA TGG ATA CCC TAC CCT TTA AGG GGG GCT GTT ATC ACT 336 
Ser Phe Lys Glu Trp He Pro Tyr Pro Leu Arg Gly Ala Val He Thr 
300 305 310 

TCT GGG AAT ATT AAA GGG CAT AGA AAA GCC CTT ATG ATT CAA GGC GTC 384 
Ser Gly Asn He Lys Gly His Arg Lys Ala Leu Met He Gin Gly Val 
320 325 



TCT AAT GTG GCT CAA TCC CAC ACT GCC TAC AAT GCC CTT TTA GAT GAT 432 
Ser Asn Val Ala Gin Ser His Thr Ala Tyr Asn Ala Leu Leu Asp Asp 
330 335 340 

TTC AAG CTT TCT CGC TTA AAT TTG AAC GCA CAA GAC GCC AAT TTA GAA 480 
Phe Lys Leu Ser Arg Leu Asn Leu Asn Ala Gin Asp Ala Asn Leu Glu 
345 350 355 360 

GAT TTG CTT TAT TTA ATC AAT CGC CCC GCT TAT GCG AAC GCA AAA GTG 528 
Asp Leu Leu Tyr Leu He Asn Arg Pro Ala Tyr Ala Asn Ala Lys vaJ. 
* 365 370 375 

TCC TTA CAG GCG GAT TTT AAC TCT CTA AAG CCT TTA GAG GGG CAT TTG 576 
Ser Leu Gin Ala Asp Phe Asn Ser Leu Lys Pro Leu Glu Gly His Leu 
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380 385 390 

ATC CTA ACA GCT AAT AAC GCT TTA ATC AAT AAC GCC CTA ATC AAT CAA 624 
He Leu Thr Ala Asn Asn Ala Leu He Asn Asn Ala Leu He Asn Gin 
395 400 405 

ATT TTT CAT TTA AAC CTT AAA GAC ACG CTT GTT TTC AGC CTC TCG CAT 672 
He Phe His Leu Asn Leu Lys Asp Thr Leu Val Phe Ser Leu Ser His 
410 415 420 

TCA AGC GAC TTT AAA GGA AAC AAA GCC ATC AGC GAT ACC ACC CTG ACT 720 
Ser Ser Asp Phe Lys Gly Asn Lys Ala He Ser Asp Thr Thr Leu Thr 
425 430 435 440 

AGC CCT TTA GCC AAT TTC AAA GCC CTA AAA AGC GAA TAC CTT TTC TCT 768 
Ser Pro Leu Ala Asn Phe Lys Ala Leu Lys Ser Glu Tyr Leu Phe Ser 
445 450 455 

ATT TTA AAA CTC AAC GCC CCC TAC ACT TTA GAA ATC CCC AAT CTA GCC 816 
He Leu Lys Leu Asn Ala Pro Tyr Thr Leu Glu He Pro Asn Leu Ala 
460 465 470 

AAA CTC TAT AAC ATT ACC AAC CAC CCC TTA AAA GGG AGC TTG ACT TTA 864 
Lys Leu Tyr Asn He Thr Asn His Pro Leu Lys Gly Ser Leu Thr Leu 
* 475 480 485 

AAA GGC GCT ATA GAA CAA AGC CCC AAA CTT TTA AAA GTC AGC GGC CAT 912 
Lys Gly Ala He Glu Gin Ser Pro Lys Leu Leu Lys Val Ser Gly His 
490 495 500 

TCA AAT TTA CTA GAC GGC GCG CTG GAT TTC ACG CTT TTA AAT AAA GAT 960 
Ser Asn Leu Leu Asp Gly Ala Leu Asp Phe Thr Leu Leu Asn Lys Asp 
505 510 515 520 

TTG AAA GGG CGT TTT TCC AAT ATT TCC ACT TTA AAA GCT TTA GAT TTA 1008 
Leu Lys Gly Arg Phe Ser Asn He Ser Thr Leu Lys Ala Leu Asp Leu 
525 530 535 

TTC CAT TAC CCT AAG TTT TTC CAA TCC GTT GCA GAC GCT AAT TTG GAT 1056 
Phe His Tyr Pro Lys Phe Phe Gin Ser Val Ala Asp Ala Asn Leu Asp 
540 545 550 

TAT GAT CTT ATC GCT AAG CAA GGC GTA TTG AAA GCC CGC CTA AAA AAC 1104 
Tyr Asp Leu He Ala Lys Gin Gly Val Leu Lys Ala Arg Leu Lys Asn 
555 560 565 

GCA AGA TTC CTC AAA AAT GCA TTC AGC GAT TTT CTC TAC TCC ATT TCT 1152 
Ala Arg Phe Leu Lys Asn Ala Phe Ser Asp Phe Leu Tyr Ser He Ser 
570 575 580 

AAA TTT GAT ATT ACA AAA GAA ATT TAT AAC GAT GCC AAT CTG GTA AGC 1200 
Lys Phe Asp He Thr Lys Glu He Tyr Asn Asp Ala Asn Leu Val Ser 
585 590 595 600 

CAA ATC AAC CAG CAA CGC CTG CTC TCT GAT CTG AGT TTA AAA AGC CCC 1248 
Gin He Asn Gin Gin Arg Leu Leu Ser Asp Leu Ser Leu Lys Ser Pro 
605 610 615 

AAA ACC CAA TTG AAA ATC CAT AAC GGT TTG TTG GAT TTA AAC ACC AAA 1296 
Lys Thr Gin Leu Lys He His Asn Gly Leu Leu Asp Leu Asn Thr Lys 
620 625 630 
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CAA ATG AAC ATG CTC ATG GAT GCG GAA ATT TTA AAA TTC ATT TTT AAA 1344 
Gin Met Asn Met Leu Met Asp Ala Glu lie Leu Lys Phe He Phe Lys 
635 640 645 

ATG AAA CTT CAA GGC AAC ATG CAC CAG CCA AAA TTT TCT CTC ATT TTA 1392 
Met Lys Leu Gin Gly Asn Met His Gin Pro Lys Phe Ser Leu He Leu 
650 655 660 

AAC GAA AAA GCC ATT CAG CAA AAC TTG CAA CAA GGC TTG AAA GAA ATC 1440 
Asn Glu Lys Ala He Gin Gin Asn Leu Gin Gin Gly Leu Lys Glu lie 
665 670 675 680 

TTA AAA AAC GAC ACC CTT AAA AAA GGT TTA GAT CAT TTG CTT AAA GAT 1488 
Leu Lys Asn Asp Thr Leu Lys Lys Gly Leu Asp His Leu Leu Lys Asp 
685 690 695 

GAT AAG CTC AAA GAA AAG CTT GAA AAA GGG CTT AAG GGG CTT TTT TAA 1536 
Asp Lys Leu Lys Glu Lys Leu Glu Lys Gly Leu Lys Gly Leu Phe 
700 705 1 



(2) ANGABEN ZU SEQ ID NO: 44: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 512 Aminosauren 

(B) ART: Aminos aure 
(D) TOPOLOGIE : linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 44: 

Met Lys Lys Leu Leu Tyr Thr He Leu Ala Leu Leu Leu He Gly Leu 
15 10 15 

Leu Thr He Tyr Leu He Leu Phe Thr Glu Trp Gly Asn Lys He He 
20 25 30 

Ala Ser Tyr He Glu Lys Lys He Asn Pro Asn Glu His Tyr Leu Ser 
35 40 45 

Val Lys Thr Phe Lys Leu Arg Phe Asn Ser Leu Asp Phe Lys Ala Gin 
50 55 60 

Ala Asn Asp Asp Ser Thr Leu He Leu Lys Gly Asp Phe Ser Leu Leu 
65 70 75 80 

Lys Gin Ser Val Asn Leu Asn Tyr His He Asp He Lys Asp Leu Arg 

85 90 95 

Ser Phe Lys Glu Trp He Pro Tyr Pro Leu Arg Gly Ala Val He Thr 
100 105 HO 

Ser Gly Asn He Lys Gly His Arg Lys Ala Leu Met He Gin Gly Val 
115 120 125 

Ser Asn Val Ala Gin Ser His Thr Ala Tyr Asn Ala Leu Leu Asp Asp 
130 135 140 

Phe Lys Leu Ser Arg Leu Asn Leu Asn Ala Gin Asp Ala Asn Leu Glu 
145 150 155 160 

Asp Leu Leu Tyr Leu He Asn Arg Pro Ala Tyr Ala Asn Ala Lys Val 
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165 170 175 

Ser Leu Gin Ala Asp Phe Asn Ser Leu Lys Pro Leu Glu Gly His Leu 
180 185 190 

lie Leu Thr Ala Asn Asn Ala Leu lie Asn Asn Ala Leu He Asn Gin 
195 200 205 

He Phe His Leu Asn Leu Lys Asp Thr Leu Val Phe Ser Leu Ser His 
210 215 220 

Ser Ser Asp Phe Lys Gly Asn Lys Ala He Ser Asp Thr Thr Leu Thr 
225 230 235 240 

Ser Pro Leu Ala Asn Phe Lys Ala Leu Lys Ser Glu Tyr Leu Phe Ser 
245 250 255 

He Leu Lys Leu Asn Ala Pro Tyr Thr Leu Glu He Pro Asn Leu Ala 
260 265 270 

Lvs Leu Tyr Asn He Thr Asn His Pro Leu Lys Gly Ser Leu Thr Leu 
1 275 280 285 

Lys Gly Ala He Glu Gin Ser Pro Lys Leu Leu Lys Val Ser Gly His 
290 295 300 

Ser Asn Leu Leu Asp Gly Ala Leu Asp Phe Thr Leu Leu Asn Lys Asp 
305 310 315 320 

Leu Lvs Gly Arg Phe Ser Asn He Ser Thr Leu Lys Ala Leu Asp Leu 
330 335 



325 



Phe His Tyr Pro Lys Phe Phe Gin Ser Val Ala Asp Ala Asn Leu Asp 
345 350 



340 



Tyr Asp Leu He Ala Lys Gin Gly Val Leu Lys Ala Arg Leu Lys Asn 
355 360 365 

Ala Arg Phe Leu Lys Asn Ala Phe Ser Asp Phe Leu Tyr Ser He Ser 
370 375 380 

Lvs Phe Asp He Thr Lys Glu He Tyr Asn Asp Ala Asn Leu Val Ser 
385 390 395 400 

Gin He Asn Gin Gin Arg Leu Leu Ser Asp Leu Ser Leu Lys Ser Pro 
405 410 415 

Lys Thr Gin Leu Lys He His Asn Gly Leu Leu Asp Leu Asn Thr Lys 
420 425 430 

Gin Met Asn Met Leu Met Asp Ala Glu He Leu Lys Phe He Phe Lys 
435 440 445 

Met Lys Leu Gin Gly Asn Met His Gin Pro Lys Phe Ser Leu He Leu 
450 455 460 

Asn Glu Lys Ala He Gin Gin Asn Leu Gin Gin Gly Leu Lys Glu He 
465 470 475 480 

Leu Lys Asn Asp Thr Leu Lys Lys Gly Leu Asp His Leu Leu Lys Asp 
485 490 495 
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Asp Lys Leu Lys Glu Lys Leu Glu Lys Gly Leu Lys Gly Leu Phe 
500 505 510 



(2) ANGABEN ZU SEQ ID NO: 45: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 540 Basenpaare 
» (B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE : linear 



(vii) UNMITTELBARE HERKUNFT: 
(B) CLON(E) : HPS144 

(ix) MERKMAL: 

(A) NAME/ SCHLUSSEL : CDS 

(B) LAGE:1..S40 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 45: 

ATG AAG AGA TCT TCT GTA TTT AGT TTC TTG GTA GCT TTT TTA TTG GTA 4 8 

Met Lys Arg Ser Ser Val Phe Ser Phe Leu Val Ala Phe Leu Leu Val 
515 520 525 

GCT GGC TGT AGT CAT AAA ATG GAT AAT AAG ACT GTG GCC GGC GAT GTG 96 
Ala Gly Cys Ser His Lys Met Asp Asn Lys Thr Val Ala Gly Asp Val 
530 535 540 

AGT GCT AAA ACG GTT CAG ACT GCA CCT GTT ACT ACA GAA CCA GCT CCA 144 
Ser Ala Lys Thr Val Gin Thr Ala Pro Val Thr Thr Glu Pro Ala Pro 
545 550 555 560 

GAG AAA GAA GAG CCT AAA CAA GAG CCA GCT CCA GTG GTT GAA GAA AAA 192 
Glu Lys Glu Glu Pro Lys Gin Glu Pro Ala Pro Val Val Glu Glu Lys 
565 570 575 

CCG GCT GTT GAG AGC GGG ACT ATC ATC GCT TCT ATT TAT TTT GAT TTT 240 
Pro Ala Val Glu Ser Gly Thr lie lie Ala Ser lie Tyr Phe Asp Phe 
580 585 590 

GAC AAG TAT GAA ATC AAA GAA TCC GAT CAA GAG ACT TTA GAT GAG ATC 288 
Asp Lys Tyr Glu lie Lys Glu Ser Asp Gin Glu Thr Leu Asp Glu lie 
595 600 605 

GTG CAA AAA GCT AAA GAA AAC CAC ATG CAA GTG CTT TTG GAA GGC AAT 336 
Val Gin Lys Ala Lys Glu Asn His Met Gin Val Leu Leu Glu Gly Asn 
610 615 620 

ACC GAT GAA TTT GGC TCT AGC GAA TAC AAC CAA GCG CTT GGC GTT AAA 384 
Thr Asp Glu Phe Gly Ser Ser Glu Tyr Asn Gin Ala Leu Gly Val Lys 
625 630 635 640 

AGG ACT TTG AGC GTG AAA AAC GCT TTA GTC ATT AAA GGG GTA GAA AAA 432 
Arg Thr Leu Ser Val Lys Asn Ala Leu Val lie Lys Gly Val Glu Lys 
645 650 655 



GAT ATG ATC AAA ACC ATC AGT TTT GGT GAA ACC AAA CCC AAA TGC GCC 
Asp Met He Lys Thr He Ser Phe Gly Glu Thr Lys Pro Lys Cys Ala 



480 
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660 665 670 

CAA AAA ACT AGA GAG TGT TAT AAA GAA AAC AGA AGA GTG GAT GTC AAA 528 
Gin Lys Thr Arg Glu Cys Tyr Lys Glu Asn Arg Arg Val Asp Val Lys 
675 680 685 

TTA ATG AAG TAA 540 
Leu Met Lys * 
690 



(2) ANGABEN ZU SEQ ID NO: 46: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 180 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DBS MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 46: 

Met Lys Arg Ser Ser Val Phe Ser Phe Leu Val Ala Phe Leu Leu Val 
15 10 15 

Ala Gly Cys Ser His Lys Met Asp Asn Lys Thr Val Ala Gly Asp Val 
20 25 30 

Ser Ala Lys Thr Val Gin Thr Ala Pro Val Thr Thr Glu Pro Ala Pro 
35 40 45 

Glu Lys Glu Glu Pro Lys Gin Glu Pro Ala Pro Val Val Glu Glu Lys 
50 55 60 

Pro Ala Val Glu Ser Gly Thr lie lie Ala Ser lie Tyr Phe Asp Phe 
65 70 75 80 

Asp Lys Tyr Glu lie Lys Glu Ser Asp Gin Glu Thr Leu Asp Glu lie 
85 90 95 

Val Gin Lys Ala Lys Glu Asn His Met Gin Val Leu Leu Glu Gly Asn 
100 105 110 

Thr Asp Glu Phe Gly Ser Ser Glu Tyr Asn Gin Ala Leu Gly Val Lys 
115 120 125 

Arg Thr Leu Ser Val Lys Asn Ala Leu Val lie Lys Gly Val Glu Lys 
130 135 140 

Asp Met lie Lys Thr lie Ser Phe Gly Glu Thr Lys Pro Lys Cys Ala 
145 150 155 160 

Gin Lys Thr Arg Glu Cys Tyr Lys Glu Asn Arg Arg Val Asp Val Lys 
165 170 175 

Leu Met Lys * 
180 

(2) ANGABEN ZU SEQ ID NO: 47: 

( i ) SEQUENZKENNZE I CHEN : 

(A) LANGE: 1557 Basenpaare 

(B) ART: Nucleotid 



9 
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(C) STRANGFORM: be ides 

(D) TOPOLOGIE: linear 



(vii) UNMI TTELB ARE HERKUNFT : 

(B) CLON(E) : HPC140, HPC150, HPC179 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE:1..1557 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 47: 

ATG ATA AAA AAG AAT AGA ACG CTG TTT CTT AGT CTA GCC CTT TGC GCT 48 
Met lie Lys Lys Asn Arg Thr Leu Phe Leu Ser Leu Ala Leu Cys Ala 
185 190 195 

AGC ATA AGT TAT GCC GAA GAT GAT GGA GGG TTT TTC ACC GTC GGT TAT 96 
Ser lie Ser Tyr Ala Glu Asp Asp Gly Gly Phe Phe Thr Val Gly Tyr 
200 205 210 

CAG CTC GGG CAA GTC ATG CAA GAT GTC CAA AAC CCA GGC GGC GCT AAA 144 
Gin Leu Gly Gin Val Met Gin Asp Val Gin Asn Pro Gly Gly Ala Lys 
215 220 225 

AGC GAC GAA CTC GCC AGA GAG CTT AAC GCT GAT GTA ACG AAC AAC ATT 192 
Ser Asp Glu Leu Ala Arg Glu Leu Asn Ala Asp Val Thr Asn Asn lie 
230 235 240 

TTA AAC AAC AAC ACC GGA GGC AAC ATC GCA GGG GCG TTG AGT AAC GCT 240 
Leu Asn Asn Asn Thr Gly Gly Asn lie Ala Gly Ala Leu Ser Asn Ala 
245 250 255 260 

TTC TCC CAA TAC CTT TAT TCG CTT TTA GGG GCT TAC CCC ACA AAA CTC 288 
Phe Ser Gin Tyr Leu Tyr Ser Leu Leu Gly Ala Tyr Pro Thr Lys Leu 
265 270 275 

AAT GGT AGC GAT GTG TCT GCG AAC GCT CTT TTA AGT GGT GCG GTA GGC 336 
Asn Gly Ser Asp Val Ser Ala Asn Ala Leu Leu Ser Gly Ala Val Gly 
280 285 290 

TCT GGG ACT TGT GCG GCT GCA GGG ACG GCT GGT GGC ACT TCT CTT AAC 384 
Ser Gly Thr Cys Ala Ala Ala Gly Thr Ala Gly Gly Thr Ser Leu Asn 
295 300 305 

ACT CAA AGC ACT TGC ACC GTT GCG GGC TAT TAC TGG CTC CCT AGC TTG 432 
Thr Gin Ser Thr Cys Thr Val Ala Gly Tyr Tyr Trp Leu Pro Ser Leu 
310 315 320 

ACT GAC AGG ATT TTA AGC ACG ATC GGC AGC CAG ACT AAC TAC GGC ACG 480 
Thr Asp Arg lie Leu Ser Thr lie Gly Ser Gin Thr Asn Tyr Gly Thr 
325 330 335 340 

AAC ACC AAT TTC CCC AAC ATG CAA CAA CAG CTC ACC TAC TTG AAT GCG 528 
Asn Thr Asn Phe Pro Asn Met Gin Gin Gin Leu Thr Tyr Leu Asn Ala 
345 350 355 

GGG AAT GTG TTT TTT AAT GCG ATG AAT AAG GCT TTA GAG AAT AAG AAT 576 
Gly Asn Val Phe Phe Asn Ala Met Asn Lys Ala Leu Glu Asn Lys Asn 
360 365 370 



WO 00/73502 



PCT/EPOO/05024 



72 

GGA ACT AGT AGT GCT AGT GGA ACT AGT GGT GCG ACT GGT TCA GAT GGT 624 
Gly Thr Ser Ser Ala Ser Gly Thr Ser Gly Ala Thr Gly Ser Asp Gly 
375 380 385 

CAA ACT TAC TCC ACA CAA GCT ATC CAA TAC CTT CAA GGC CAA CAA AAT 672 
Gin Thr Tyr Ser Thr Gin Ala lie Gin Tyr Leu Gin Gly Gin Gin Asn 
390 395 400 

ATC TTA AAT AAC GCA GCG AAC TTG CTC AAG CAA GAT GAA TTG CTC TTA 720 
lie Leu Asn Asn Ala Ala Asn Leu Leu Lys Gin Asp Glu Leu Leu Leu 
405 410 415 420 

GAA GCT TTC AAC TCT GCC GTA GCC GCC AAC ATT GGG AAT AAG GAA TTC 768 
Glu Ala Phe Asn Ser Ala Val Ala Ala Asn He Gly Asn Lys Glu Phe 
425 430 435 

AAT TCA GCC GCT TTT ACA GGT TTG GTG CAA GGC ATT ATT GAT CAA TCT 816 
Asn Ser Ala Ala Phe Thr Gly Leu Val Gin Gly He He Asp Gin Ser 
440 445 450 

CAA GCG GTT TAT AAC GAG CTC ACT AAA AAC ACC ATT AGC GGG AGT GCG 864 
Gin Ala Val Tyr Asn Glu Leu Thr Lys Asn Thr He Ser Gly Ser Ala 
455 460 465 

GTT ATT AGC GCT GGG ATA AAC TCC AAC CAA GCT AAC GCT GTG CAA GGG 912 
Val He Ser Ala Gly He Asn Ser Asn Gin Ala Asn Ala Val Gin Gly 
470 475 480 

CGC GCT AGT CAG CTC CCT AAC GCT CTT TAT AAC GCG CAA GTA ACT TTG 960 
Arg Ala Ser Gin Leu Pro Asn Ala Leu Tyr Asn Ala Gin Val Thr Leu 
485 490 495 500 

GAT AAA ATC AAT GCG CTC AAT AAT CAA GTG AGA AGC ATG CCT TAC TTG 1008 
Asp Lys He Asn Ala Leu Asn Asn Gin Val Arg Ser Met Pro Tyr Leu 
505 510 515 

CCC CAA TTC AGA GCC GGG AAC AGC CGT TCA ACG AAT ATT TTA AAC GGG 1056 
Pro Gin Phe Arg Ala Gly Asn Ser Arg Ser Thr Asn He Leu Asn Gly 
520 525 530 

TTT TAC ACC AAA ATA GGC TAT AAG CAA TTC TTC GGG AAG AAA AGG AAT 1104 
Phe Tyr Thr Lys He Gly Tyr Lys Gin Phe Phe Gly Lys Lys Arg Asn 
535 540 545 

ATC GGT TTG CGC TAT TAT GGT TTC TTT TCT TAT AAC GGA GCG AGC GTG 1152 
He Gly Leu Arg Tyr Tyr Gly Phe Phe Ser Tyr Asn Gly Ala Ser Val 
550 555 560 

GGC TTT AGA TCC ACT CAA AAT AAT GTA GGG TTA TAC ACT TAT GGG GTG 1200 
Gly Phe Arg Ser Thr Gin Asn Asn Val Gly Leu Tyr Thr Tyr Gly Val 
565 570 575 580 

GGG ACT GAT GTG TTG TAT AAC ATC TTT AGC CGC TCC TAT CAA AAC CGC 1248 
Gly Thr Asp Val Leu Tyr Asn He Phe Ser Arg Ser Tyr Gin Asn Arg 
585 590 595 

TCT GTG GAT ATG GGC TTT TTT AGC GGT ATC CAA TTA GCC GGT GAG ACC 1296 
Ser Val Asp Met Gly Phe Phe Ser Gly He Gin Leu Ala Gly Glu Thr 
600 605 610 

TTC CAA TCC ACG CTC AGA GAT GAC CCC AAT GTG AAA TTG CAT GGG AAA 1344 
Phe Gin Ser Thr Leu Arg Asp Asp Pro Asn Val Lys Leu His Gly Lys 
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615 620 625 

ATC AAT AAC ACG CAC TTC CAG TTC CTC TTT GAC TTC GGT ATG AGG ATG 13 92 

lie Asn Asn Thr His Phe Gin Phe Leu Phe Asp Phe Gly Met Arg Met 
630 635 640 

AAC TTC GGT AAG TTG GAC GGG AAA TCC AAC CGC CAC AAC CAG CAC ACG 1440 
Asn Phe Gly Lys Leu Asp Gly Lys Ser Asn Arg His Asn Gin His Thr 
645 650 655 660 

GTG GAA TTT GGC GTA GTG GTG CCT ACG ATT TAT AAC ACT TAT TAC AAA 1488 
Val Glu Phe Gly Val Val Val Pro Thr lie Tyr Asn Thr Tyr Tyr Lys 
665 670 675 

TCA GCA GGG ACT ACC GTG AAG TAT TTC CGT CCT TAT AGC GTT TAT TGG 1536 
Ser Ala Gly Thr Thr Val Lys Tyr Phe Arg Pro Tyr Ser Val Tyr Trp 
680 685 690 

TCT TAT GGG TAT TCA TTC TAA 1557 
Ser Tyr Gly Tyr Ser Phe * 
695 

(2) ANGABEN ZU SEQ ID NO: 48: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 519 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG : SEQ ID NO: 48: 

Met lie Lys Lys Asn Arg Thr Leu Phe Leu Ser Leu Ala Leu Cys Ala 
15 10 15 

Ser He Ser Tyr Ala Glu Asp Asp Gly Gly Phe Phe Thr Val Gly Tyr 
20 25 30 

Gin Leu Gly Gin Val Met Gin Asp Val Gin Asn Pro Gly Gly Ala Lys 
35 40 45 

Ser Asp Glu Leu Ala Arg Glu Leu Asn Ala Asp Val Thr Asn Asn He 
50 55 60 

Leu Asn Asn Asn Thr Gly Gly Asn He Ala Gly Ala Leu Ser Asn Ala 
65 70 75 80 

Phe Ser Gin Tyr Leu Tyr Ser Leu Leu Gly Ala Tyr Pro Thr Lys Leu 
85 90 95 

Asn Gly Ser Asp Val Ser Ala Asn Ala Leu Leu Ser Gly Ala Val Gly 
100 105 110 

Ser Gly Thr Cys Ala Ala Ala Gly Thr Ala Gly Gly Thr Ser Leu Asn 
115 120 125 

Thr Gin Ser Thr Cys Thr Val Ala Gly Tyr Tyr Trp Leu Pro Ser Leu 
130 135 140 

Thr Asp Arg He Leu Ser Thr He Gly Ser Gin Thr Asn Tyr Gly Thr 
145 150 155 160 
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Asn Thr Asn Phe Pro Asn Met Gin Gin Gin Leu Thr Tyr Leu Asn Ala 
165 170 175 

Gly Asn Val Phe Phe Asn Ala Met Asn Lys Ala Leu Glu Asn Lys Asn 
180 185 190 

Gly Thr Ser Ser Ala Ser Gly Thr Ser Gly Ala Thr Gly Ser Asp Gly 
195 200 205 

Gin Thr Tyr Ser Thr Gin Ala lie Gin Tyr Leu Gin Gly Gin Gin Asn 
210 215 220 

lie Leu Asn Asn Ala Ala Asn Leu Leu Lys Gin Asp Glu Leu Leu Leu 
225 230 235 240 

Glu Ala Phe Asn Ser Ala Val Ala Ala Asn lie Gly Asn Lys Glu Phe 
245 250 255 

Asn Ser Ala Ala Phe Thr Gly Leu Val Gin Gly lie lie Asp Gin Ser 
260 265 270 

Gin Ala Val Tyr Asn Glu Leu Thr Lys Asn Thr He Ser Gly Ser Ala 
275 280 285 

Val He Ser Ala Gly He Asn Ser Asn Gin Ala Asn Ala Val Gin Gly 
290 295 300 

Arg Ala Ser Gin Leu Pro Asn Ala Leu Tyr Asn Ala Gin Val Thr Leu 
305 310 315 320 

Asp Lys He Asn Ala Leu Asn Asn Gin Val Arg Ser Met Pro Tyr Leu 
325 330 335 

Pro Gin Phe Arg Ala Gly Asn Ser Arg Ser Thr Asn He Leu Asn Gly 
340 345 350 

Phe Tyr Thr Lys He Gly Tyr Lys Gin Phe Phe Gly Lys Lys Arg Asn 
355 360 365 

He Gly Leu Arg Tyr Tyr Gly Phe Phe Ser Tyr Asn Gly Ala Ser Val 
370 375 380 

Gly Phe Arg Ser Thr Gin Asn Asn Val Gly Leu Tyr Thr Tyr Gly Val 
385 390 395 400 

Gly Thr Asp Val Leu Tyr Asn He Phe Ser Arg Ser Tyr Gin Asn Arg 
405 410 415 

Ser Val Asp Met Gly Phe Phe Ser Gly He Gin Leu Ala Gly Glu Thr 
420 425 430 

Phe Gin Ser Thr Leu Arg Asp Asp Pro Asn Val Lys Leu His Gly Lys 
435 440 445 

He Asn Asn Thr His Phe Gin Phe Leu Phe Asp Phe Gly Met Arg Met 
450 455 460 

Asn Phe Gly Lys Leu Asp Gly Lys Ser Asn Arg His Asn Gin His Thr 
465 470 475 480 

Val Glu Phe Gly Val Val Val Pro Thr He Tyr Asn Thr Tyr Tyr Lys 
485 490 495 
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Ser Ala Gly Thr Thr Val Lys Tyr Phe Arg Pro Tyr Ser Val Tyr Trp 
500 505 510 

Ser Tyr Gly Tyr Ser Phe * 
515 

(2) ANGABEN ZU SEQ ID NO: 49: 

(i) SEQUENZKENNZEICHEN : 

(A) LANGE: 1062 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM : beides 

(D) TOPOLOGIE : linear 



(vii) UNMITTELBARE HERKUNFT : 
(B) CLON(E) : HPS152 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL : CDS 

(B) LAGE : 1 . .1062 

(xi) SEQUENZBESCHREIBUNG : SEQ ID NO: 49: 

TTG AAA CAT TTA ACC CCA CTC ACT CAC ACC ATC TTT AAA GCC TTA TGG 48 
Leu Lys His Leu Thr Pro Leu Thr His Thr lie Phe Lys Ala Leu Trp 
520 525 530 535 

CTA GGC ACA GCC TTA AGT GCA TCT TTA AGT TTA GCC GCA ACA GAA AGC 96 
Leu Gly Thr Ala Leu Ser Ala Ser Leu Ser Leu Ala Ala Thr Glu Ser 
540 545 550 

CCC ACT AAA ACA GAG CCT AAG CCC GCT AAA GGG GTT AAA AAC AAG CCC 144 
Pro Thr Lys Thr Glu Pro Lys Pro Ala Lys Gly Val Lys Asn Lys Pro 
555 560 565 

AAA TCG CCC GTT ACT AAA GTC ATG ATG ACC AAT TGC GAC AAT ATT AAA 192 
Lys Ser Pro Val Thr Lys Val Met Met Thr Asn Cys Asp Asn lie Lys 
570 575 580 

GAT TTT AAC GCT AAG CAA AAA GAA GTC TTA AAA GCC GCT TAT CAA TTC 240 
Asp Phe Asn Ala Lys Gin Lys Glu Val Leu Lys Ala Ala Tyr Gin Phe 
585 590 595 

GGC TCT AAA GAA AAT TTA GGC TAT GAA ATG GCA GGC ATT GCA TGG AAA 288 
Gly Ser Lys Glu Asn Leu Gly Tyr Glu Met Ala Gly lie Ala Trp Lys 
600 605 610 615 

GAG TCA TGC GCA GGG GTT TAT AAA ATC AAT TTT TCG GAT CCG AGC GCG 336 
Glu Ser Cys Ala Gly Val Tyr Lys He Asn Phe Ser Asp Pro Ser Ala 
620 625 630 

GGC GTG TAT CAT TCT TAT ATC CCA AGC GTT CTA AAA AGC TAT GGG CAT 384 
Gly Val Tyr His Ser Tyr He Pro Ser Val Leu Lys Ser Tyr Gly His 
635 640 645 

AAT GAT AGC CCC TTT TTG CGT AAT GTG ATG GGG GAA TTG CTC ATT AAA 432 
Asn Asp Ser Pro Phe Leu Arg Asn Val Met Gly Glu Leu Leu He Lys 
650 655 660 
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GAC GAT GCG TTT GCT TCT GAA GTG GCT TTA AAA GAG TTG CTC TAT TGG 480 
Asp Asp Ala Phe Ala Ser Glu Val Ala Leu Lys Glu Leu Leu Tyr Trp 
665 670 675 

AAA ACA CGC TAC CAT GAC AAT TTA AAA GAC ATG ATT AAA TCT TAC AAC 528 
Lvs Thr Arg Tyr His Asp Asn Leu Lys Asp Met He Lys Ser Tyr Asn 
680 685 690 695 

AAG GGC AGT CGT TGG GAA AGG AGC GAA AAA TCT AAC GCT GAT GCT GAA 576 
Lys Gly Ser Arg Trp Glu Arg Ser Glu Lys Ser Asn Ala Asp Ala Glu 
700 705 710 

AAA TAT TAC GAA GAG ATA CAA GAC AGA ATC AGG CGT TTG AAA GAA TCT 624 
Lys Tyr Tyr Glu Glu He Gin Asp Arg He Arg Arg Leu Lys Glu Ser 
715 720 725 

AAA ATC TTT GAT TCG CAG TCT AGT AAT GAC CAA GAA TTG CAA AAA AGC 672 
Lys He Phe Asp Ser Gin Ser Ser Asn Asp Gin Glu Leu Gin Lys Ser 
730 735 740 

GCT AAT AGC AAC CTG GAT TTA GAC CCT ATC GGC AAC GCC ATG CCC CAA 720 
Ala Asn Ser Asn Leu Asp Leu Asp Pro He Gly Asn Ala Met Pro Gin 
745 750 755 

GCC TTA ATT GCC AAA GAA ACT AAA ATA GAA GAA ACC CAA GCA GAA AAA 768 
Ala Leu He Ala Lys Glu Thr Lys He Glu Glu Thr Gin Ala Glu Lys 
760 765 770 775 

TCC CAA GAA ATG AAA GAG ACA ACT AGC GAG CAA ACA AAA AGT AAG CCA 816 
Ser Gin Glu Met Lys Glu Thr Thr Ser Glu Gin Thr Lys Ser Lys Pro 
780 785 790 

GAA AAA GCA AAA GAT AAA CCC ATG TAT TTG GCG CAA ATC AAC AGC ACT 864 
Glu Lys Ala Lys Asp Lys Pro Met Tyr Leu Ala Gin He Asn Ser Thr 
795 800 80S 

GAT TTC ACA CCC GTT AAA AAA AGC CCC AAA AAA CCG GCT AAA GTG AGC 912 
Asp Phe Thr Pro Val Lys Lys Ser Pro Lys Lys Pro Ala Lys Val Ser 
810 815 820 

CAA AAA CAC TCC TTT AAG AAT AAC ATT AAA AAT AAT GTA AAA AAC AAC 960 
Gin Lys His Ser Phe Lys Asn Asn He Lys Asn Asn Val Lys Asn Asn 
825 830 835 

GCC AAA ACC GCT TCC AAA AAA CAA GAA ATG TGC AAA AAT TGC TCT CCA 1008 
Ala Lys Thr Ala Ser Lys Lys Gin Glu Met Cys Lys Asn Cys Ser Pro 
840 845 850 855 

GGG CAA AGG AAT GCG ATT TTA GCT AAC CAC ATC ACT CTC ATG CAA GAG 1056 
Gly Gin Arg Asn Ala He Leu Ala Asn His He Thr Leu Met Gin Glu 
860 865 870 



CTT TAA 
Leu * 



1062 



(2) ANGABEN ZU SEQ ID NO: 50: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 354 Amino saur en 

(B) ART: Aminosaure 
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(D) TOPOLOGIE: linear 



(ii) ART DBS MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG : SEQ ID NO: 50: 

Leu Lys His Leu Thr Pro Leu Thr His Thr lie Phe Lys Ala Leu Trp 
15 10 15 

Leu Gly Thr Ala Leu Ser Ala Ser Leu Ser Leu Ala Ala Thr Glu Ser 
20 25 30 

Pro Thr Lys Thr Glu Pro Lys Pro Ala Lys Gly Val Lys Asn Lys Pro 
35 40 45 

Lys Ser Pro Val Thr Lys Val Met Met Thr Asn Cys Asp Asn lie Lys 
50 55 60 

Asp Phe Asn Ala Lys Gin Lys Glu Val Leu Lys Ala Ala Tyr Gin Phe 
65 70 75 80 

Gly Ser Lys Glu Asn Leu Gly Tyr Glu Met Ala Gly lie Ala Trp Lys 

85 90 95 

Glu Ser Cys Ala Gly Val Tyr Lys lie Asn Phe Ser Asp Pro Ser Ala 
100 105 110 

Gly Val Tyr His Ser Tyr lie Pro Ser Val Leu Lys Ser Tyr Gly His 
115 120 125 

Asn Asp Ser Pro Phe Leu Arg Asn Val Met Gly Glu Leu Leu He Lys 
130 135 140 

Asp Asp Ala Phe Ala Ser Glu Val Ala Leu Lys Glu Leu Leu Tyr Trp 
145 150 155 160 

Lvs Thr Arg Tyr His Asp Asn Leu Lys Asp Met He Lys Ser Tyr Asn 
165 170 175 

Lys Gly Ser Arg Trp Glu Arg Ser Glu Lys Ser Asn Ala Asp Ala Glu 
180 185 190 

Lys Tyr Tyr Glu Glu He Gin Asp Arg He Arg Arg Leu Lys Glu Ser 
195 200 205 

Lys He Phe Asp Ser Gin Ser Ser Asn Asp Gin Glu Leu Gin Lys Ser 
210 215 220 

Ala Asn Ser Asn Leu Asp Leu Asp Pro He Gly Asn Ala Met Pro Gin 
225 230 235 240 

Ala Leu He Ala Lys Glu Thr Lys He Glu Glu Thr Gin Ala Glu Lys 
245 250 255 

Ser Gin Glu Met Lys Glu Thr Thr Ser Glu Gin Thr Lys Ser Lys Pro 
260 265 270 

Glu Lys Ala Lys Asp Lys Pro Met Tyr Leu Ala Gin He Asn Ser Thr 
275 280 285 

Asp Phe Thr Pro Val Lys Lys Ser Pro Lys Lys Pro Ala Lys Val Ser 
290 295 300 
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Gin Lys His Ser Phe Lys Asn Asn 
305 310 

Ala Lys Thr Ala Ser Lys Lys Gin 
325 

Gly Gin Arg Asn Ala lie Leu Ala 
340 



Leu * 



78 

lie Lys Asn Asn Val Lys Asn Asn 
315 320 

Glu Met Cys Lys Asn Cys Ser Pro 
330 335 

Asn His lie Thr Leu Met Gin Glu 
345 350 



(2) ANGABEN ZU SEQ ID NO: 51: 

( i ) SEQUENZKENNZE I CHEN : 

(A) LANGE: 2202 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT : 
(B) CLON(E) : HPS155 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE : 1 . .2202 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 51: 

ATG GCA AAC GAA CGC TCC AAA TTA GCT TTT AAA AAG ACT TTC CCT GTC 48 
Met Ala Asn Glu Arg Ser Lys Leu Ala Phe Lys Lys Thr Phe Pro Val 
355 360 365 370 

TTT AAA CGC TTT TTG CAA TCC AAA GAC TTA GCC CTT GTG GTC TTT GTG 96 
Phe Lys Arg Phe Leu Gin Ser Lys Asp Leu Ala Leu Val Val Phe Val 
375 380 385 

ATC GCT ATT TTG GCG ATC ATT ATC GTG CCG TTA CCG CCT TTT GTG TTG 144 
lie Ala lie Leu Ala lie lie lie Val Pro Leu Pro Pro Phe Val Leu 
390 395 400 

GAT TTT TTA CTC ACG ATT TCT ATC GCG CTG TCG GTG TTG ATT ATT TTA 192 
Asp Phe Leu Leu Thr lie Ser He Ala Leu Ser Val Leu He He Leu 
405 410 415 

ATT GGG CTT TAT ATT GAC AAG CCG ACT GAT TTT AGC GCT TTC CCC ACT 240 
He Gly Leu Tyr He Asp Lys Pro Thr Asp Phe Ser Ala Phe Pro Thr 
420 425 430 

TTA TTG CTC ATT GTA ACC TTG TAT CGC TTG GCT TTA AAT GTC GCC ACC 2 88 

Leu Leu Leu He Val Thr Leu Tyr Arg Leu Ala Leu Asn Val Ala Thr 
435 440 445 450 

ACT AGA ATG ATT TTA ACG CAA GGC TAT AAA GGG CCT AGT GCG GTG AGC 336 
Thr Arg Met He Leu Thr Gin Gly Tyr Lys Gly Pro Ser Ala Val Ser 
455 460 465 

GAT ATT ATC ACG GCG TTT GGG GAA TTT AGC GTG AGC GGG AAT TAT GTG 384 
Asp He He Thr Ala Phe Gly Glu Phe Ser Val Ser Gly Asn Tyr Val 
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470 475 480 

ATT GGG GCG ATT ATC TTT AGT ATT TTA GTG CTA GTG AAT CTA TTA GTG 432 
lie Gly Ala lie lie Phe Ser lie Leu Val Leu Val Asn Leu Leu Val 
485 490 495 

GTT ACT AAT GGC TCT ACT AGG GTT ACT GAA GTG AGG GCG CGA TTT GCC 480 
Val Thr Asn Gly Ser Thr Arg Val Thr Glu Val Arg Ala Arg Phe Ala 
500 505 510 

CTA GAT GCT ATG CCA GGA AAG CAA ATG GCG ATT GAT GCG GAT TTA AAC 528 
Leu Asp Ala Met Pro Gly Lys Gin Met Ala lie Asp Ala Asp Leu Asn 
515 520 525 530 

TCA GGA CTT ATT GAC GAT AAG GAA GCC AAA AAA CGG CGC GCC GCT CTA 576 
Ser Gly Leu lie Asp Asp Lys Glu Ala Lys Lys Arg Arg Ala Ala Leu 
535 540 545 

AGC CAA GAA GCG GAT TTT TAT GGC GCG ATG GAT GGC GCA TCT AAA TTC 624 
Ser Gin Glu Ala Asp Ph« Tyr Gly Ala Met Asp Gly Ala Ser Lys Phe 
550 555 560 

GTC AAA GGC GAT GCG ATC GCT TCT ATC ATC ATC ACG CTT ATC AAT ATC 672 
Val Lys Gly Asp Ala He Ala Ser He He He Thr Leu He Asn He 
565 570 575 

ATT GGA GGG TTT TTA GTG GGC GTG TTT CAA AGG GAT ATG AGC TTG AGC 720 
He Gly Gly Phe Leu Val Gly Val Phe Gin Arg Asp Met Ser Leu Ser 
580 585 590 

TTT AGC GCT AGC ACT TTC ACT ATC TTA ACC ATT GGC GAT GGG CTT GTG 768 
Phe Ser Ala Ser Thr Phe Thr He Leu Thr He Gly Asp Gly Leu Val 
595 600 605 610 

GGG CAA ATC CCT GCC TTA ATC ATT GCG ACA GCG ACC GGT ATT GTC GCC 816 
Gly Gin He Pro Ala Leu He He Ala Thr Ala Thr Gly He Val Ala 
615 620 625 

ACT CGC ACC ACG CAA AAT GAA GAA GAG GAC TTT GCT TCC AAA CTC ATC 864 
Thr Arg Thr Thr Gin Asn Glu Glu Glu Asp Phe Ala Ser Lys Leu He 
630 635 640 

ACA CAG CTC ACC AAT AAA AGC AAA ACT TTA GTG ATT GTG GGA GCG ATT 912 
Thr Gin Leu Thr Asn Lys Ser Lys Thr Leu Val He Val Gly Ala He 
645 650 655 

TTA TTG CTT TTT GCC ACC ATT CCT GGA CTC CCT ACC TTT TCT TTA GCG 960 
Leu Leu Leu Phe Ala Thr ^le Pro Gly Leu Pro Thr Phe Ser Leu Ala 
660 665 670 

TTT GTA GGG ACT CTC TTT TTA TTC ATC GCA TGG CTG ATT AGC AGG GAG 1008 
Phe Val Gly Thr Leu Phe Leu Phe He Ala Trp Leu He Ser Arg Glu 
675 680 685 690 

GGG AAA GAC GGG CTG CTC ACT AAA TTA GAA AAT TAT TTG AGT CAA AAA 1056 
Gly Lys Asp Gly Leu Leu Thr Lys Leu Glu Asn Tyr Leu Ser Gin Lys 
695 700 705 

TTC GGC TTG GAT TTG AGC GAA AAA CCC CAC AGC TCC AAA ATC AAA CCC 1104 
Phe Gly Leu Asp Leu Ser Glu Lys Pro His Ser Ser Lys He Lys Pro 
710 715 720 
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CAC ACC CCA ACC ACA AGG GCT AAA ACC CAA GAA GAG CTT AAA AGA GAA 1152 
His Thr Pro Thr Thr Arg Ala Lys Thr Gin Glu Glu Leu Lys Arg Glu 
725 730 735 

GAA GAG CAA GCG ATT GAT GAA GTG TTA AAA ATT GAA TTT TTA GAA CTG 1200 
Glu Glu Gin Ala He Asp Glu Val Leu Lys He Glu Phe Leu Glu Leu 
740 745 750 

GCT TTA GGC TAT CAA CTC ATC AGT CTT GCG GAC ATG AAA CAA GGG GGC 124 8 

Ala Leu Gly Tyr Gin Leu He Ser Leu Ala Asp Met Lys Gin Gly Gly 
755 760 765 770 

GAT TTG TTA GAA AGG ATT AGG GGT ATT AGA AAA AAG ATA GCG AGC GAT 1296 
Asp Leu Leu Glu Arg He Arg Gly lie Arg Lys Lys He Ala Ser Asp 
775 780 785 

TAT GGT TTT TTG ATG CCT CAA ATC CGG ATC AGG GAT AAT TTG CAG CTC 1344 
Tyr Gly Phe Leu Met Pro Gin He Arg He Arg Asp Asn Leu Gin Leu 
790 795 800 

CCC CCA ACG CAT TAT GAA ATC AAA CTT AAA GGC ATT GTG ATT GGT GAG 13 92 

Pro Pro Thr His Tyr Glu He Lys Leu Lys Gly He Val He Gly Glu 
805 810 815 

GGC ATG GTG ATG CCA GAC AAG TTT TTA GCC ATG AAT ACC GGT TTT GTG 1440 
Gly Met Val Met Pro Asp Lys Phe Leu Ala Met Asn Thr Gly Phe Val 
820 825 830 

AAT AAA GAA ATT GAA GGC ATT CCT ACT AAA GAG CCG GCT TTT GGA ATG 1488 
Asn Lys Glu He Glu Gly He Pro Thr Lys Glu Pro Ala Phe Gly Met 
835 840 845 850 

GAC GCT TTA TGG ATT GAA ACT AAA AAT AAA GAA GAA GCC ATT ATT CAA 1536 
Asp Ala Leu Trp He Glu Thr Lys Asn Lys Glu Glu Ala He He Gin 
855 860 865 

GGC TAT ACC ATT ATT GAT CCA AGC ACC GTT ATT GCG ACG CAC ACC AGC 1584 
Gly Tyr Thr He He Asp Pro Ser Thr Val He Ala Thr His Thr Ser 
870 875 880 

GAA TTA GTG AAA AAA TAC GCT GAA GAT TTT ATC ACT AAA GAT GAA GTG 1632 
Glu Leu Val Lys Lys Tyr Ala Glu Asp Phe He Thr Lys Asp Glu Val 
885 890 895 

AAA TCC CTT TTA GAG CGC TTG GCC AAA GAT TAT CCT ACG ATT GTA GAA 1680 
Lys Ser Leu Leu Glu Arg Leu Ala Lys Asp Tyr Pro Thr He Val Glu 
900 905 910 

GAG AGT AAA AAA ATC CCC ACC GGT GCG ATC CGA TCA GTC TTG CAA GCC 1728 
Glu Ser Lys Lys He Pro Thr Gly Ala He Arg Ser Val Leu Gin Ala 
915 920 925 930 

TTG TTA CAT GAA AAA ATC CCC ATT AAA GAC ATG CTC ACT ATT TTA GAA 1776 
Leu Leu His Glu Lys He Pro He Lys Asp Met Leu Thr He Leu Glu 
935 940 945 

ACG ATT ACC GAT ATT GCC CCA TTG GTT CAA AAC GAT GTG AAT ATC TTA 1824 
Thr He Thr Asp He Ala Pro Leu Val Gin Asn Asp Val Asn He Leu 
950 955 960 

ACC GAA CAA GTG AGG GCG AGG CTT TCT AGG GTG ATC ACT AAC GCT TTT 1872 
Thr Glu Gin Val Arg Ala Arg Leu Ser Arg Val He Thr Asn Ala Phe 
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965 970 975 

AAA TCT GAA GAC GGG CGT TTG AAA TTT TTA ACC TTT TCT ACC GAT AGC 1920 
Lys Ser Glu Asp Gly Arg Leu Lys Phe Leu Thr Phe Ser Thr Asp Ser 
980 985 990 

GAA CAA TTT TTG CTT AAT AAA TTG CGA GAA AAT GGC ACT TCT AAA AGT 1968 
Glu Gin Phe Leu Leu Asn Lys Leu Arg Glu Asn Gly Thr Ser Lys Ser 
995 1000 1005 1010 

TTG CTG CTC AAT GTG GGC GAA TTG CAA AAA CTC ATT GAA GTG GTC TCT 2016 
Leu Leu Leu Asn Val Gly Glu Leu Gin Lys Leu He Glu Val Val Ser 
1015 1020 1025 

GAA GAG GCC ATG AAA GTC TTG CAA AAA GGG ATC GCT CCG GTG ATT TTG 2064 
Glu Glu Ala Met Lys Val Leu Gin Lys Gly He Ala Pro Val He Leu 
1030 1035 1040 

ATC GTA GAG CCT AAT TTA AGA AAA GCT CTT TCC AAT CAA ATG GAG CAA 2112 
He Val Glu Pro Asn Leu Arg Lys Ala Leu Ser Asn Gin Met Glu Gin 
1045 1050 1055 

GCC AGG ATT GAT GTG ATC GTG CTA AGC CAT GCG GAA TTA GAT CCT AAC 2160 
Ala Arg He Asp Val He Val Leu Ser His Ala Glu Leu Asp Pro Asn 
1060 1065 1070 

TCT AAT TTT GAA GCT TTA GGC ACG ATC CAT ATT AAC TTT TAA 2202 
Ser Asn Phe Glu Ala Leu Gly Thr He His He Asn Phe * 
1075 1080 1085 

(2) ANGABEN ZU SEQ ID NO: 52: 

(i) SEQUENZKENNZE I CHEN : 

(A) LANGE: 734 Amino saur en 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 52: 

Met Ala Asn Glu Arg Ser Lys Leu Ala Phe Lys Lys Thr Phe Pro Val 
15 10 15 

Phe Lys Arg Phe Leu Gin Ser Lys Asp Leu Ala Leu Val Val Phe Val 
20 25 30 

He Ala He Leu Ala He -lie He Val Pro Leu Pro Pro Phe Val Leu 
35 40 45 

Asp Phe Leu Leu Thr He Ser He Ala Leu Ser Val Leu He He Leu 
50 55 60 

He Gly Leu Tyr He Asp Lys Pro Thr Asp Phe Ser Ala Phe Pro Thr 
65 70 75 80 

Leu Leu Leu He Val Thr Leu Tyr Arg Leu Ala Leu Asn Val Ala Thr 
85 90 95 

Thr Arg Met He Leu Thr Gin Gly Tyr Lys Gly Pro Ser Ala Val Ser 
100 105 110 
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Asp lie He Thr Ala Phe Gly Glu Phe Ser Val Ser Gly Asn Tyr Val 
115 120 125 

He Gly Ala He He Phe Ser He Leu Val Leu Val Asn Leu Leu Val 
130 135 140 

Val Thr Asn Gly Ser Thr Arg Val Thr Glu Val Arg Ala Arg Phe Ala 
145 150 155 160 

Leu Asp Ala Met Pro Gly Lys Gin Met Ala He Asp Ala Asp Leu Asn 
165 170 175 

Ser Gly Leu He Asp Asp Lys Glu Ala Lys Lys Arg Arg Ala Ala Leu 
180 185 190 

Ser Gin Glu Ala Asp Phe Tyr Gly Ala Met Asp Gly Ala Ser Lys Phe 
195 200 205 

Val Lys Gly Asp Ala He Ala Ser He He He Thr Leu He Asn He 
210 215 220 

He Gly Gly Phe Leu Val Gly Val Phe Gin Arg Asp Met Ser Leu Ser 
225 230 235 240 

Phe Ser Ala Ser Thr Phe Thr He Leu Thr He Gly Asp Gly Leu Val 
245 250 255 

Gly Gin He Pro Ala Leu He He Ala Thr Ala Thr Gly He Val Ala 
260 265 270 

Thr Arg Thr Thr Gin Asn Glu Glu Glu Asp Phe Ala Ser Lys Leu He 
275 280 285 

Thr Gin Leu Thr Asn Lys Ser Lys Thr Leu Val He Val Gly Ala He 
290 295 300 

Leu Leu Leu Phe Ala Thr He Pro Gly Leu Pro Thr Phe Ser Leu Ala 
305 310 315 320 

Phe Val Gly Thr Leu Phe Leu Phe He Ala Trp Leu He Ser Arg Glu 
325 330 335 

Gly Lys Asp Gly Leu Leu Thr Lys Leu Glu Asn Tyr Leu Ser Gin Lys 
340 345 350 

Phe Gly Leu Asp Leu Ser Glu Lys Pro His Ser Ser Lys He Lys Pro 
355 360 365 

His Thr Pro Thr Thr Arg Ala Lys Thr Gin Glu Glu Leu Lys Arg Glu 
370 375 380 

Glu Glu Gin Ala He Asp Glu Val Leu Lys He Glu Phe Leu Glu Leu 
385 390 395 400 

Ala Leu Gly Tyr Gin Leu He Ser Leu Ala Asp Met Lys Gin Gly Gly 
405 410 415 

Asp Leu Leu Glu Arg He Arg Gly He Arg Lys Lys He Ala Ser Asp 
420 425 430 

Tyr Gly Phe Leu Met Pro Gin He Arg He Arg Asp Asn Leu Gin Leu 
435 440 445 
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Pro Pro Thr His Tyr Glu He Lys Leu L»ys Gly He Val He Gly Glu 
450 455 460 

Gly Met Val Met Pro Asp Lys Phe Leu Ala Met Asn Thr Gly Phe Val 
465 470 475 480 

Asn Lys Glu He Glu Gly He Pro Thr Lys Glu Pro Ala Phe Gly Met 
485 490 495 

Asp Ala Leu Trp He Glu Thr Lys Asn Lys Glu Glu Ala He He Gin 
500 505 510 

Gly Tyr Thr He He Asp Pro Ser Thr Val He Ala Thr His Thr Ser 
515 520 525 

Glu Leu Val Lys Lys Tyr Ala Glu Asp Phe He Thr Lys Asp Glu Val 
530 535 540 

Lys Ser Leu Leu Glu Arg Leu Ala Lys Asp Tyr Pro Thr He Val Glu 
545 550 555 560 

Glu Ser Lys Lys He Pro Thr Gly Ala He Arg Ser Val Leu Gin Ala 
565 570 575 

Leu Leu His Glu Lys He Pro He Lys Asp Met Leu Thr He Leu Glu 
580 585 590 

Thr He Thr Asp He Ala Pro Leu Val Gin Asn Asp Val Asn He Leu 
595 600 605 

Thr Glu Gin Val Arg Ala Arg Leu Ser Arg Val He Thr Asn Ala Phe 
610 615 620 

Lys Ser Glu Asp Gly Arg Leu Lys Phe Leu Thr Phe Ser Thr Asp Ser 
625 630 635 640 

Glu Gin Phe Leu Leu Asn Lys Leu Arg Glu Asn Gly Thr Ser Lys Ser 
645 650 655 

Leu Leu Leu Asn Val Gly Glu Leu Gin Lys Leu He Glu Val Val Ser 
660 665 670 

Glu Glu Ala Met Lys Val Leu Gin Lys Gly He Ala Pro Val He Leu 
675 680 685 

He Val Glu Pro Asn Leu Arg Lys Ala Leu Ser Asn Gin Met Glu Gin 
690 695 700 

Ala Arg He Asp Val He Val Leu Ser His Ala Glu Leu Asp Pro Asn 
705 710 715 720 

Ser Asn Phe Glu Ala Leu Gly Thr He His He Asn Phe * 
725 730 

(2) ANGABEN ZU SEQ ID NO: 53: 

(i) SEQUENZKENNZEICHEN : 

(A) LANGE: 189 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 
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(vii) UNMITTELBARE HERKUNFT : 

(B) CLON(E) : HPC157 (HPC181) 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE:1..189 

<xi) SEQUEN2BESCHREIBUNG: SEQ ID NO: 53: 

ATG CAA AAA GAA CAA GAA GCC CGA GAA ATC GCT AAA AAA GCC GTT CAA 48 
Met Gin Lys Glu Gin Glu Ala Arg Glu lie Ala Lys Lys Ala Val Gin 
735 740 745 750 

ATC GTG TTT TTT TTA GGG ATT GTG GTG GTG CTT TTG ATG ATG ATA AAC 96 
lie Val Phe Phe Leu Gly lie Val Val Val Leu Leu Met Met lie Asn 
755 760 765 

CTT TAC ATG CTC ATC AAT CAA ATC AAC GCG AGC GCT AAA ATG AGC CAA 144 
Leu Tyr Met Leu lie Asn Gin lie Asn Ala Ser Ala Lys Met Ser Gin 
770 775 780 

CAA ATC AAA AAA ATA GAA GAA AGG CTT AAC CAA GGG CAA AAA TAG 189 
Gin He Lys Lys He Glu Glu Arg Leu Asn Gin Gly Gin Lys * 
785 790 795 

(2) ANGABEN ZU SEQ ID NO: 54: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 63 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

<xi> SEQUENZBESCHREIBUNG : SEQ ID NO: 54: 

Met Gin Lys Glu Gin Glu Ala Arg Glu He Ala Lys Lys Ala Val Gin 
15 10 15 

lie Val Phe Phe Leu Gly He Val Val Val Leu Leu Met Met He Asn 
20 25 30 

Leu Tyr Met Leu He Asn Gin He Asn Ala Ser Ala Lys Met Ser Gin 
35 40 45 

Gin He Lys Lys He Glu Glu Arg Leu Asn Gin Gly Gin Lys * 
50 55 60 

(2) ANGABEN ZU SEQ ID NO: 55: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 1008 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE : linear 



(vii) UNMI TTELB ARE HERKUNFT: 
(B) CLON(E) : HPS183 
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(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE : 1 . . 1008 

(xi) SEQUENZBESCHREIBUNG : SEQ ID NO: 55: 

ATG TTA GTT ACT CGC TTT AAA AAA GCT TTC ATT TCT TAT TCT TTA GGC 48 
Met Leu Val Thr Arg Phe Lys Lys Ala Phe lie Ser Tyr Ser Leu Gly 
65 70 75 

GTG CTT GTC GCT TCA TTA TGG TTG AAC GTG TGC AAC GCT TCA GCG CAA 96 
Val Leu Val Ala Ser Leu Trp Leu Asn Val Cys Asn Ala Ser Ala Gin 
80 85 90 9S 

GAA GTC AAA GTC AAG GAT TAT TTC GGG GAG CAA ACC ATC AAG CTT CCT 144 
Glu Val Lys Val Lys Asp Tyr Phe Gly Glu Gin Thr lie Lys Leu Pro 
100 105 110 

GTT TCT AAA ATA GCC TAT ATA GGG AGC TAT GTA GAA GTG CCT GCC ATG 192 
Val Ser Lys lie Ala Tyr lie Gly Ser Tyr Val Glu Val Pro Ala Met 
115 120 125 

CTT AAT GTT TGG AAT AGG GTT GTA GGC GTT TCG GAT TAC GCT TTT AAA 240 
Leu Asn Val Trp Asn Arg Val Val Gly Val Ser Asp Tyr Ala Phe Lys 
130 135 140 

GAC GAT ATT GTC AAA GCC ACT CTC AAA GGC GAA GAT CTT AAA CGC GTC 288 
Asp Asp He Val Lys Ala Thr Leu Lys Gly Glu Asp Leu Lys Arg Val 
145 150 155 

AAA CAC ATG AGC ACT GAT CAT ACA GCC GCG CTA AAT GTA GAG CTT TTA 336 
Lys His Met Ser Thr Asp His Thr Ala Ala Leu Asn Val Glu Leu Leu 
160 165 170 175 

AAA AAG CTT AGC CCT GAT CTT GTG GTA ACC TTT GTG GGC AAC CCT AAA 384 
Lys Lys Leu Ser Pro Asp Leu Val Val Thr Phe Val Gly Asn Pro Lys 
180 185 190 

GCG GTA GAG CAT GCG AAA AAA TTT GGT ATA TCA TTT CTT TCT TTT CAA 432 
Ala Val Glu His Ala Lys Lys Phe Gly He Ser Phe Leu Ser Phe Gin 
195 200 205 

GAG ACA ACG ATT GCA GAG GCC ATG CAG GCC ATG CAA GCT CAA GCC ACG 480 
Glu Thr Thr He Ala Glu Ala Met Gin Ala Met Gin Ala Gin Ala Thr 
210 215 220 

GTT TTA GAG ATT GAC GCT TCC AAA AAA TTC GCC AAA ATG CAA GAA ACT 528 
Val Leu Glu He Asp Ala Ser Lys Lys Phe Ala Lys Met Gin Glu Thr 
225 230 235 

TTG GAT TTT ATT GCT GAG CGT TTG AAA AAT GTC AAA AAG AAA AAG GGG 576 
Leu Asp Phe He Ala Glu Arg Leu Lys Asn Val Lys Lys Lys Lys Gly 
240 245 250 255 

GTG GAG CTT TTC CAT AAA GCC AAT AAA ATC AGC GGC CAT CAA GCC ATT 624 
Val Glu Leu Phe His Lys Ala Asn Lys He Ser Gly His Gin Ala He 
260 265 270 

AGC TCA GAC ATT TTA GAA AAA GGG GGC ATA GAC AAT TTT GGC TTG AAA 672 
Ser Ser Asp He Leu Glu Lys Gly Gly He Asp Asn Phe Gly Leu Lys 
275 280 285 
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TAT GTC AAA TTT GGG CGT GCT GAC ATT AGC GTG GAA AAA ATC GTT AAA 72 0 

Tyr Val Lys Phe Gly Arg Ala Asp lie Ser Val Glu Lys lie Val Lys 
290 295 300 

GAA AAC CCT GAG ATT ATC TTT ATT TGG TGG ATA AGC CCA CTC ACG CCT 768 
Glu Asn Pro Glu lie lie Phe lie Trp Trp He Ser Pro Leu Thr Pro 
305 310 315 

GAA GAT GTG TTA AAC AAC CCC AAA TTT GCT ACC ATC AAA GCC ATT AAA 816 
Glu Asp Val Leu Asn Asn Pro Lys Phe Ala Thr He Lys Ala He Lys 
320 325 330 335 

AAC AAG CAG GTT TAT AAA CTC CCC ACA ATG GAT ATT GGC GGG CCT AGA 864 
Asn Lys Gin Val Tyr Lys Leu Pro Thr Met Asp He Gly Gly Pro Arg 
340 345 350 

GCC CCA CTC ATA AGT CTT TTT ATC GCT CTA AAA GCC CAC CCT GAA GCC 912 
Ala Pro Leu He Ser Leu Phe He Ala Leu Lys Ala His Pro Glu Ala 
355 360 365 

TTT AAG GGC GTG GAT ATT AAT GCG ATG GTT AAA GAC TAC TAT AAA GTG 960 
Phe Lys Gly Val Asp He Asn Ala Met Val Lys Asp Tyr Tyr Lys Val 
370 375 380 

GTT TTT GAT TTG AAT GAT GCA GAG GTT GAG CCC TTT TTA TGG CAT TAA 1008 
Val Phe Asp Leu Asn Asp Ala Glu Val Glu Pro Phe Leu Trp His * 
385 390 395 

(2) ANGABEN ZU SEQ ID NO: 56: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 336 Aminosauren 

(B) ART: Amino saure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEK&LS: Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 56: 

Met Leu Val Thr Arg Phe Lys Lys Ala Phe He Ser Tyr Ser Leu Gly 
15 10 15 

Val Leu Val Ala Ser Leu Trp Leu Asn Val Cys Asn Ala Ser Ala Gin 
20 25 30 

Glu Val Lys Val Lys Asp Tyr Phe Gly Glu Gin Thr He Lys Leu Pro 
35 40 45 

Val Ser Lys He Ala Tyr He Gly Ser Tyr Val Glu Val Pro Ala Met 
50 55 60 

Leu Asn Val Trp Asn Arg Val Val Gly Val Ser Asp Tyr Ala Phe Lys 
65 70 75 80 

Asp Asp He Val Lys Ala Thr Leu Lys Gly Glu Asp Leu Lys Arg Val 

85 90 95 

Lys His Met Ser Thr Asp His Thr Ala Ala Leu Asn Val Glu Leu Leu 
100 105 HO 

Lys Lys Leu Ser Pro Asp Leu Val Val Thr Phe Val Gly Asn Pro Lys 
115 120 125 
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Ala Val Glu His Ala Lys Lys Phe Gly He Ser Phe Leu Ser Phe Gin 
130 135 140 . 

Glu Thr Thr He Ala Glu Ala Met Gin Ala Met Gin Ala Gin Ala Thr 
145 150 155 160 

Val Leu Glu He Asp Ala Ser Lys Lys Phe Ala Lys Met Gin Glu Thr 
165 170 175 

Leu Asp Phe He Ala Glu Arg Leu Lys Asn Val Lys Lys Lys Lys Gly 
180 185 190 

Val Glu Leu Phe His Lys Ala Asn Lys He Ser Gly His Gin Ala He 
195 200 205 

Ser Ser Asp He Leu Glu Lys Gly Gly He Asp Asn Phe Gly Leu Lys 
210 215 220 

Tyr Val Lys Phe Gly Arg Ala Asp He Ser Val Glu Lys He Val Lys 
225 23u 235 240 

Glu Asn Pro Glu He He Phe He Trp Trp He Ser Pro Leu Thr Pro 
245 250 255 

Glu Asp Val Leu Asn Asn Pro Lys Phe Ala Thr He Lys Ala lie Lys 
260 265 270 

Asn Lys Gin Val Tyr Lys Leu Pro Thr Met Asp He Gly Gly Pro Arg 
275 280 285 

Ala Pro Leu He Ser Leu Phe He Ala Leu Lys Ala His Pro Glu Ala 
290 295 300 

Phe Lys Gly Val Asp He Asn Ala Met Val Lys Asp Tyr Tyr Lys Val 
305 310 315 320 

Val Phe Asp Leu Asn Asp Ala Glu Val Glu Pro Phe Leu Trp His * 
325 330 335 



(2) ANGABEN ZU SEQ ID NO: 57: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 240 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE:. linear 



(vii) UNMITTELBARE HERKUNFT: 
(B) CLON(E) : HPS186 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE:1..240 



(xi) SEQUENZBESCHREIBUNG : SEQ ID NO: 57: 



ATG GGC GGA TTC ACA AGC ATA TGG CAT TGG GTC ATT GTT TTA TTA GTG 
Met Gly Gly Phe Thr Ser He Trp His Trp Val He Val Leu Leu Val 



48 
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340 345 350 

ATT GTG TTG TTA TTT GGG GCT AAA AAG ATC CCA GAA TTG GCT AAA GGT 96 
lie Val Leu Leu Phe Gly Ala Lys Lys lie Pro Glu Leu Ala Lys Gly 
355 360 365 

TTA GGC AGT GGG ATT AAG AAT TTC AAA AAA GCC GTG AAA GAC GAT GAA 144 
Leu Gly Ser Gly lie Lys Asn Phe Lys Lys Ala Val Lys Asp Asp Glu 
370 375 380 

GAA GAG GCT AAA AAC GAG CCA AAA ACC CTA GAC GCT CAA GCA ACG CAA 192 
Glu Glu Ala Lys Asn Glu Pro Lys Thr Leu Asp Ala Gin Ala Thr Gin 
385 390 395 400 

ACC AAA GTG CAT GAG AGT AGC GAG ATT AAA AGC AAA CAA GAA AGT TAA 240 
Thr Lys Val His Glu Ser Ser Glu lie Lys Ser Lys Gin Glu Ser * 
405 410 415 



(2) ANGABEN ZU SEQ ID NO: 58: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 80 Aminosauren 

(B) ART : Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 58: 

Met Gly Gly Phe Thr Ser lie Trp His Trp Val lie Val Leu Leu Val 
15 10 15 

lie Val Leu Leu Phe Gly Ala Lys Lys lie Pro Glu Leu Ala Lys Gly 
20 25 30 

Leu Gly Ser Gly lie Lys Asn Phe Lys Lys Ala Val Lys Asp Asp Glu 
35 40 45 

Glu Glu Ala Lys Asn Glu Pro Lys Thr Leu Asp Ala Gin Ala Thr Gin 
50 55 60 

Thr Lys Val His Glu Ser Ser Glu lie Lys Ser Lys Gin Glu Ser * 
65 70 75 80 



(2) ANGABEN ZU SEQ ID NO: 59: 

( i ) SEQUENZKENNZE I CHEN : 

(A) LANGE : 1764 Basenpaare 
<B) ART: Nucleotid 
<C) STRANGFORM: beides 
(D) TOPOLOGIE: linear 



(vii) UNMI TTELBARE HERKUNFT: 
(B) CLON(E) : HPS188 



(ix) MERKMAL: 

(A) NAME/ SCHLUSSEL : CDS 

(B) LAGE:1. .1764 
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<xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 59: 

ATG AAA AAC TTT TCC CCA CTT TGT TGT TTT AAA AAG CTC AAA AAA CGC 48 
Met Lys Asn Phe Ser Pro Leu Cys Cys Phe Lys Lys Leu Lys Lys Arg 
85 90 95 

CAT TTA ATC GCT TTG AGC CTG CCC TTG CTT TCT TAT GOT AAT GGC TTT 96 
His Leu lie Ala Leu Ser Leu Pro Leu Leu Ser Tyr Ala Asn Gly Phe 
100 105 110 

AAA ATC CAA GAG CAA AGC CTG AAT GGC ACG GCT TTA GGC TCG GCG TAT 144 
Lys lie Gin Glu Gin Ser Leu Asn Gly Thr Ala Leu Gly Ser Ala Tyr 
115 120 . 125 

GTC GCT GGG GCT AGG GGG GCT GAT GCT TCC TTT TAT AAC CCG GCG AAT 192 
Val Ala Gly Ala Arg Gly Ala Asp Ala Ser Phe Tyr Asn Pro Ala Asn 
130 135 140 

ATG GGC TTT ACT AAC GAT TGG GAT GAA AAC AGA AGC GAA TTT GAA ATG 240 
Met Gly Phe Thr Asn Asp Trp Asp Glu Asn Arg Ser Glu Phe Glu Met 
145 150 155 160 

ACC ACC ACC GTG ATT AAT ATC CCG GCC TTT AAG TTT CAA GTC CCT ACG 288 
Thr Thr Thr Val lie Asn lie Pro Ala Phe Lys Phe Gin Val Pro Thr 
165 170 175 

ACT AAT CAA GGC TTG TAT TCG GTT ACG AGC TTA CAA ATT GAT AAA AGC 336 
Thr Asn Gin Gly Leu Tyr Ser Val Thr Ser Leu Gin lie Asp Lys Ser 
180 185 190 

CAA CAA AAT ATT TTA GGC ATC ATC AAC ACT ATA GGG CTT AGC AAT ATC 384 
Gin Gin Asn lie Leu Gly He He Asn Thr He Gly Leu Ser Asn He 
195 200 205 

CTT AAA GCG CTT GGC AAT ACG GCC GCT ACC AAT GGC TTA TCA CAA GCA 432 
Leu Lys Ala Leu Gly Asn Thr Ala Ala Thr Asn Gly Leu Ser Gin Ala 
210 215 220 

ATC AAT CGG GTT CAA GGG CTT ATG AAT CTA ACC AAT CAA AAA GTC GTA 4 80 

He Asn Arg Val Gin Gly Leu Met Asn Leu Thr Asn Gin Lys Val Val 
225 230 235 240 

ACC CTC GCT TCA AAA CCT GAC ACC CAA ATC GTG AAT GGC TGG ACG GGA 528 
Thr Leu Ala Ser Lys Pro Asp Thr Gin He Val Asn Gly Trp Thr Gly 
245 250 255 

ACG ACT AAT TTT GTT TTA CCC AAA TTC TTT TAT AAA ACG CGC ACG CAT 576 
Thr Thr Asn Phe Val Leu Pro Lys Phe Phe Tyr Lys Thr Arg Thr His 
260 265 270 

AAC GGC TTC ACT TTT GGG GGG AGT TTT ACC GCT CCT AGC GGG TTG GGC 624 
Asn Gly Phe Thr Phe Gly Gly Ser Phe Thr Ala Pro Ser Gly Leu Gly 
275 280 285 

ATG AAA TGG AAT GGT AAA GGG GGG GAA TTT TTG CAT GAC GTG TTT ATC 672 
Met Lys Trp Asn Gly Lys Gly Gly Glu Phe Leu His Asp Val Phe He 
290 295 300 

ATG ATG GTA GAG CTT GCC CCT AGC ATG AGC TAT ACT GTT AAT AAG CAC 72 0 

Met Met Val Glu Leu Ala Pro Ser Met Ser Tyr Thr Val Asn Lys His 
305 310 315 320 
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TTT TCC GTG GGC GTG GGC TTA AGG GGG CTT TAT GCG ACC GGG AGC TTT 768 
Phe Ser Val Gly Val Gly Leu Arg Gly Leu Tyr Ala Thr Gly Ser Phe 
325 330 335 

AAT AAC ACC GTT TAT GTG CCT TTA GAG GGC GCT TCG GTT TTG AGC GCG 816 
Asn Asn Thr Val Tyr Val Pro Leu Glu Gly Ala Ser Val Leu Ser Ala 
340 345 350 

GAG CAA ATT TTA AAT TTA CCC AAC AAT GTT TTT GCC GAT CAA GTG CCA 864 
Glu Gin He Leu Asn Leu Pro Asn Asn Val Phe Ala Asp Gin Val Pro 
355 360 365 

AGT AAC ATG ATG ACT TTA TTA GGC AAT ATT GGC TAC CAA CCA GCG CTT 912 
Ser Asn Met Met Thr Leu Leu Gly Asn lie Gly Tyr Gin Pro Ala Leu 
370 375 380 

AAT TGC CAA AAA GCC GGT GGG GAT ATG AGC GAT CAG AGC TGT CAA GAG 960 
Asn Cys Gin Lys Ala Gly Gly Asp Met Ser Asp Gin Ser Cys Gin Glu 
385 390 395 400 

TTT TAT AAC GGC TTG AAA AAA ATC ATG GGC TAT AGC GGC TTA ATC AAA 1008 
Phe Tyr Asn Gly Leu Lys Lys He Met Gly Tyr Ser Gly Leu He Lys 
405 410 415 

GCG AGC GCG AAT CTT TAT GGC ACG ACT CAA GTC GTG CAA AAA TCT AAC 1056 
Ala Ser Ala Asn Leu Tyr Gly Thr Thr Gin Val Val Gin Lys Ser Asn 
420 425 430 

GGG CAA GGC GTA TCG GGG GGC TAT AGA GTG GGT TCG AGT TTG CGT GTG 1104 
Gly Gin Gly Val Ser Gly Gly Tyr Arg Val Gly Ser Ser Leu Arg Val 
435 440 445 

TTT GAT CAT GGC ATG TTT TCG GTG GTG TAT AAT TCT TCA GTT ACA TTC 1152 
Phe Asp His Gly Met Phe Ser Val Val Tyr Asn Ser Ser Val Thr Phe 
450 455 460 

AAT ATG AAA GGC GCT CTA GTG GCT ATC ACC GAG CTT GGC CCT TCT TTA 1200 
Asn Met Lys Gly Ala Leu Val Ala He Thr Glu Leu Gly Pro Ser Leu 
465 470 475 480 

GGG AGC GTT TTG ACT AAA GGC AGC TTG AAT ATC AAT GTT TCA CTC CCC 124 8 

Gly Ser Val Leu Thr Lys Gly Ser Leu Asn He Asn Val Ser Leu Pro 
485 490 495 

CAA ACC CTA AGC CTA GCC TAC GCC CAC CAA TTT TTT AAA GAC CAT TTA 1296 
Gin Thr Leu Ser Leu Ala Tyr Ala His Gin Phe Phe Lys Asp His Leu 
500 505 510 

AGA ATA GAG GGG GTG TTT GAG CGT ACC TTT TGG AGT CAA GGG AAT AAA 1344 
Arg He Glu Gly Val Phe Glu Arg Thr Phe Trp Ser Gin Gly Asn Lys 
515 520 525 

TTT TTA GTA ACC CCT GAT TTT GCG AAC GCT ACT TAC AAG GGC TTG AGC 1392 
Phe Leu Val Thr Pro Asp Phe Ala Asn Ala Thr Tyr Lys Gly Leu Ser 
530 535 540 

GGA ACG GTG GCT TCA CTA GAC TCT GAG ACG CTT AAA AAA ATG GTA GGC 1440 
Gly Thr Val Ala Ser Leu Asp Ser Glu Thr Leu Lys Lys Met Val Gly 
545 550 555 560 

TTA GCG AAT TTT AAA AGC GTG ATG AAC ATG GGG GCT GGC TGG AGA GAC 1488 
Leu Ala Asn Phe Lys Ser Val Met Asn Met Gly Ala Gly Trp Arg Asp 
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565 570 575 

ACC AAC ACC TTT AGA TTA GGG GTA ACT TAC ATG GGT AAA AGC TTG CGT 1536 
Thr Asn Thr Phe Arg Leu Gly Val Thr Tyr Met Gly Lys Ser Leu Arg 
580 585 590 

TTG ATG GGT GCT ATT GAT TAT GAC CAA GCC CCA AGC CCC CAA GAC GCG 1584 
Leu Met Gly Ala lie Asp Tyr Asp Gin Ala Pro Ser Pro Gin Asp Ala 
595 600 605 

ATA GGT ATC CCA GAT TCC AAT GGC TAT ACC GTG GCT TTT GGG ACT AAA 1632 
He Gly He Pro Asp Ser Asn Gly Tyr Thr Val Ala Phe Gly Thr Lys 
610 615 620 

TAC AAT TTT AGG GGC TTT GAT TTA GGC GTA GCG GGG AGT TTC ACT TTT 1680 
Tyr Asn Phe Arg Gly Phe Asp Leu Gly Val Ala Gly Ser Phe Thr Phe 
625 630 635 640 

AAA AGC AAC CGC TCC AGT TTG TAT CAA TCC CCA AAC ATT GGG CAA TTG 1728 
Lys Ser Asn Arg Ser Sex Leu Tyr Gin Ser Pro Asn He Gly Gin Leu 
645 650 655 

AGA ATC TTT AGC GCC TCT TTA GGC TAT CGC TGG TAA 1764 
Arg He Phe Ser Ala Ser Leu Gly Tyr Arg Trp * 
660 665 



(2) ANGABEN ZU SEQ ID NO: 60: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 588 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS Protein 

<xi) SEQUENZBESCHREIBUNG : SEQ ID NO: 60: 

Met Lys Asn Phe Ser Pro Leu Cys Cys Phe Lys Lys Leu Lys Lys Arg 
15 10 15 

His Leu He Ala Leu Ser Leu Pro Leu Leu Ser Tyr Ala Asn Gly Phe 
20 25 30 

Lys He Gin Glu Gin Ser Leu Asn Gly Thr Ala Leu Gly Ser Ala Tyr 
35 40 45 

Val Ala Gly Ala Arg Gly Ala Asp Ala Ser Phe Tyr Asn Pro Ala Asn 
50 55 60 

Met Gly Phe Thr Asn Asp Trp Asp Glu Asn Arg Ser Glu Phe Glu Met 
65 70 75 80 

Thr Thr Thr Val He Asn He Pro Ala Phe Lys Phe Gin Val Pro Thr 
85 90 95 

Thr Asn Gin Gly Leu Tyr Ser Val Thr Ser Leu Gin He Asp Lys Ser 
100 105 110 

Gin Gin Asn He Leu Gly He He Asn Thr He Gly Leu Ser Asn He 
115 120 125 

Leu Lys Ala Leu Gly Asn Thr Ala Ala Thr Asn Gly Leu Ser Gin Ala 
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130 135 140 

lie Asn Arg Val Gin Gly Leu Met Asn Leu Thr Asn Gin Lys Val Val 
145 150 155 160 

Thr Leu Ala Ser Lys Pro Asp Thr Gin lie Val Asn Gly Trp Thr Gly 
165 170 175 

Thr Thr Asn Phe Val Leu Pro Lys Phe Phe Tyr Lys Thr Arg Thr His 
180 185 190 

Asn Gly Phe Thr Phe Gly Gly Ser Phe Thr Ala Pro Ser Gly Leu Gly 
195 200 205 

Met Lys Trp Asn Gly Lys Gly Gly Glu Phe Leu His Asp Val Phe lie 
210 215 220 

Met Met Val Glu Leu Ala Pro Ser Met Ser Tyr Thr Val Asn Lys His 
225 230 235 240 

Phe Ser Val Gly Val Gly Leu Arg Gly Leu Tyr Ala Thr Gly Ser Phe 
245 250 255 

Asn Asn Thr Val Tyr Val Pro Leu Glu Gly Ala Ser Val Leu Ser Ala 
260 265 270 

Glu Gin He Leu Asn Leu Pro. Asn Asn Val Phe Ala Asp Gin Val Pro 
275 280 285 

Ser Asn Met Met Thr Leu Leu Gly Asn He Gly Tyr Gin Pro Ala Leu 
290 295 300 

Asn Cys Gin Lys Ala Gly Gly Asp Met Ser Asp Gin Ser Cys Gin Glu 
305 310 315 320 

Phe Tyr Asn Gly Leu Lys Lys He Met Gly Tyr Ser Gly Leu He Lys 
325 330 335 

Ala Ser Ala Asn Leu Tyr Gly Thr Thr Gin Val Val Gin Lys Ser Asn 
340 345 350 

Gly Gin Gly Val Ser Gly Gly Tyr Arg Val Gly Ser Ser Leu Arg Val 
355 360 365 

Phe Asp His Gly Met Phe Ser Val Val Tyr Asn Ser Ser Val Thr Phe 
370 375 380 

Asn Met Lys Gly Ala Leu Val Ala He Thr Glu Leu Gly Pro Ser Leu 
385 390 395 400 

Gly Ser Val Leu Thr Lys Gly Ser Leu Asn He Asn Val Ser Leu Pro 
405 410 415 

Gin Thr Leu Ser Leu Ala Tyr Ala His Gin Phe Phe Lys Asp His Leu 
420 425 430 

Arg He Glu Gly Val Phe Glu Arg Thr Phe Trp Ser Gin Gly Asn Lys 
435 440 445 

Phe Leu Val Thr Pro Asp Phe Ala Asn Ala Thr Tyr Lys Gly Leu Ser 
450 455 460 
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Gly Thr Val Ala Ser Leu Asp Ser Glu Thr Leu Lys Lys Met Val Gly 
465 470 475 480 

Leu Ala Asn Phe Lys Ser Val Met Asn Met Gly Ala Gly Trp Arg Asp 
485 490 495 

Thr Asn Thr Phe Arg Leu Gly Val Thr Tyr Met Gly Lys Ser Leu Arg 
500 505 510 

Leu Met Gly Ala lie Asp Tyr Asp Gin Ala Pro Ser Pro Gin Asp Ala 
515 520 525 

He Gly He Pro Asp Ser Asn Gly Tyr Thr Val Ala Phe Gly Thr Lys 
530 535 540 

Tyr Asn Phe Arg Gly Phe Asp Leu Gly Val Ala Gly Ser Phe Thr Phe 
545 550 555 560 

Lys Ser Asn Arg Ser Ser Leu Tyr Gin Ser Pro Asn He Gly Gin Leu 
565 570 575 

Arg He Phe Ser Ala Ser Leu Gly Tyr Arg Trp * 
580 585 

(2) ANGABEN ZU SEQ ID NO: 61: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 1443 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT: 
(B) CLON(E) : HPS190 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE:1..1443 



<xi) SEQUENZBESCHREIBUNG: SEQ II 

TTG GAA TTG AAA AAA ATC GCC CTT ATT 
Leu Glu Leu Lys Lys He Ala Leu He 
590 595 

AAT TTT TTA GAC TTG GTG CTA AGG CAT 
Asn Phe Leu Asp Leu Val Leu Arg His 
605 610 

ATA GTG GTT GTC AAA AAT GAG AGC CTT 
He Val Val Val Lys Asn Glu Ser Leu 
625 

ACT TTC GCT TTT TAT TGT TTT GAT GCG 
Thr Phe Ala Phe Tyr Cys Phe Asp Ala 
640 645 

CAA GTG TTA AAC GAT GAG GTG AGC GAT 
Gin Val Leu Asn Asp Glu Val Ser Asp 



I NO: 61: 

TTA GAT GGC ATT GTA GCA AAA 48 
Leu Asp Gly He Val Ala Lys 
600 

TAT TCT AAT CAT AAT TTT TAT 96 
Tyr Ser Asn His Asn Phe Tyr 
615 620 

ATC CCT AAA AAT TAC CCG AGC 144 
He Pro Lys Asn Tyr Pro Ser 
630 635 

ACT TCT AGT TTC AGG CTT TTG 192 
Thr Ser Ser Phe Arg Leu Leu 
650 

GCG TTT TTA ATC ATA CAA GAT 240 
Ala Phe Leu He He Gin Asp 
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655 660 665 

TTT AAA GAA CAG CGC ATC ATT CAT AAA ATC ATT CAA ACC CAT TTC AAA 288 
Phe Lys Glu Gin Arg lie lie His Lys lie He Gin Thr His Phe Lys 
670 675 680 

CGC ATG CGC GTG GTT TTG AGC GTG AAA AAA GAT GGT GAA AAA ACT TTA 336 
Arg Met Arg Val Val Leu Ser Val Lys Lys Asp Gly Glu Lys Thr Leu 
685 690 695 700 

GAA AAT AAT GAA GAA AAT AAA GAT GAA AAG CTT ATT TTG ATT GAT GAA 384 
Glu Asn Asn Glu Glu Asn Lys Asp Glu Lys Leu He Leu He Asp Glu 
705 710 715 

TTT GAA GTT TTA GCC AAT AAA TTC ATT TCT CGT TTG CCT AAT ATC CCT 432 
Phe Glu Val Leu Ala Asn Lys Phe He Ser Arg Leu Pro Asn He Pro 
720 725 730 

AGC ACC CCT AGA GAA TTT GGG TTA GCC AAA GGC GAG ATC ATG GAG ATT 480 
Ser Thr Pro Arg Glu Phe Gly Leu Ala Lys Gly Glu He Met Glu He 
735 740 745 

GAT GTG CCT TTT GGG AGT ATT TTT CCT TAC AGG CAT ATT GGC TCT ATC 528 
Asp Val Pro Phe Gly Ser He Phe Pro Tyr Arg His He Gly Ser He 
750 755 760 

AGC CAA CAA GAA TAC AGG ATT GTA GGG CTT TAT CGC AAC GAT GTT TTG 576 
Ser Gin Gin Glu Tyr Arg He Val Gly Leu Tyr Arg Asn Asp Val Leu 
765 770 775 780 

TTG CTC TCC ACT AAA TCT TTA GTT ATC CAG CCA CGA GAC ATT CTT TTA 624 
Leu Leu Ser Thr Lys Ser Leu Val He Gin Pro Arg Asp He Leu Leu 
785 790 795 

GTG GCG GGT AAT CCG GAA ATT TTA AAC GCG GTG TAT CTT CAG GTC AAA 672 
Val Ala Gly Asn Pro Glu He Leu Asn Ala Val Tyr Leu Gin Val Lys 
800 805 810 

AGC AAT GTC GGG CAG TTC CCA GCC CCC TTT GGT AAG AGC ATT TAT TTA 720 
Ser Asn Val Gly Gin Phe Pro Ala Pro Phe Gly Lys Ser He Tyr Leu 
815 820 825 

TAC ATT GAT ATG CGC TTA CCA AAG CCG AAA GCA ATG ATG CCC GAT GTG 768 
Tyr He Asp Met Arg Leu Pro Lys Pro Lys Ala Met Met Pro Asp Val 
830 835 840 

TAT CAA GCC TTG TTT TTG _CAC AAA CAT TTA AAG AGC TAC AAG CTC TAC 816 
Tyr Gin Ala Leu Phe Leu His Lys His Leu Lys Ser Tyr Lys Leu Tyr 
845 850 855 860 

ATT CAG GTT TTA CAC CCC ACT AGC CCT AAG TTT TGC CAT AAA TTT TTA 864 
He Gin Val Leu His Pro Thr Ser Pro Lys Phe Cys His Lys Phe Leu 
865 870 875 

TCG CTA GAA ACC GAA AGC ATT GAA GTG AAT TTT GAT TTT TAT GGG AAA 912 
Ser Leu Glu Thr Glu Ser He Glu Val Asn Phe Asp Phe Tyr Gly Lys 
880 885 890 

AGT TTT ATC CAA AAA CTC CAT GAA GAC CAC CAG AAA AAA ATG GGT TTG 960 
Ser Phe He Gin Lys Leu His Glu Asp His Gin Lys Lys Met Gly Leu 
895 900 905 
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ATT GTG GTA GGC AGA GAG CTT TTT TTA TCT AAA AAA CAC CGA AAA GCC 1008 
He Val Val Gly Arg Glu Leu Phe Leu Ser Lys Lys His Arg Lys Ala 
910 915 920 

CTA TAT AAA ACA GCC ACC CCG GTT TAT AAA ACC AAC ACT TCC GGC TTG 1056 
Leu Tyr Lys Thr Ala Thr Pro Val Tyr Lys Thr Asn Thr Ser Gly Leu 
925 930 935 940 

TCT AAA ACC TCT CAA AGC GTG GTG GTG TTG AAT GAA AGC TTG GAT ATC 1104 
Ser Lys Thr Ser Gin Ser Val Val Val Leu Asn Glu Ser Leu Asp He 
945 950 955 

AAT GAG GAC ATG TCT TCA GTG ATC TTT GAT GTG TCT ATG CAA ATG GAT 1152 
Asn Glu Asp Met Ser Ser Val He Phe Asp Val Ser Met Gin Met Asp 
960 965 910 

TTG GGC TTG TTG CTC TAT GAT TTT GAC CCT AAC AAG CGC TAT AAA AAC 1200 
Leu Gly Leu Leu Leu Tyr Asp Phe Asp Pro Asn Lys Arg Tyr Lys Asn 
975 980 985 

GAG ATT GTC AAT CAT TAT GAA AAT TTA GCC AAC ACG CTC AAC CGC AAG 1248 
Glu He Val Asn His Tyr Glu Asn Leu Ala Asn Thr Leu Asn Arg Lys 
990 995 1000 

ATT GAG ATT TTT CAA ACC GAT ATT AGA AAT CCT ATC ATG TAT CTC AAT 1296 
He Glu He Phe Gin Thr Asp He Arg Asn Pro He Met Tyr Leu Asn 
1005 1010 1015 1020 

TCT TTA AGA AAT CCC ATT TTG CAT TTC ATG CCT TTT GAA GAG TGC ATC 1344 
Ser Leu Arg Asn Pro He Leu His Phe Met Pro Phe Glu Glu Cys He 
1025 1030 1035 

ACG CAC ACG CGC TTT TGG TGG TTT TTA TCC ACT AAA GTG GAA AAA TTA 1392 
Thr His Thr Arg Phe Trp Trp Phe Leu Ser Thr Lys Val Glu Lys Leu 
1040 1045 1050 

GCG TTT TTA AAC GAT GAT AAC CCT CAA ATT TTT ATC CCT GTA GCG GAG 1440 
Ala Phe Leu Asn Asp Asp Asn Pro Gin He Phe He Pro Val Ala Glu 
1055 106.0 1065 



TGA 
* 



1443 



(2) ANGABEN ZU SEQ ID NO: 62: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 481 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG : SEQ ID NO: 62: 

Leu Glu Leu Lys Lys He Ala Leu He Leu Asp Gly He Val Ala Lys 
1 5 10 15 

Asn Phe Leu Asp Leu Val Leu Arg His Tyr Ser Asn His Asn Phe Tyr 
20 25 30 

He Val Val Val Lys Asn Glu Ser Leu He Pro Lys Asn Tyr Pro Ser 
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35 40 45 

Thr Phe Ala Phe Tyr Cys Phe Asp Ala Thr Ser Ser Phe Arg Leu Leu 
50 55 60 

Gin Val Leu Asn Asp Glu Val Ser Asp Ala Phe Leu lie lie Gin Asp 
65 70 75 80 

Phe Lys Glu Gin Arg He He His Lys He He Gin Thr His Phe Lys 
85 90 95 

Arg Met Arg Val Val Leu Ser Val Lys Lys Asp Gly Glu Lys Thr Leu 
100 105 HO 

Glu Asn Asn Glu Glu Asn Lys Asp Glu Lys Leu He Leu He Asp Glu 
115 120 125 

Phe Glu Val Leu Ala Asn Lys Phe He Ser Arg Leu Pro Asn He Pro 
130 135 140 

Ser Thr Pro Arg Glu Phe Gly Leu Ala Lys Gly Glu He Met Glu lie 
145 150 155 160 

Asp Val Pro Phe Gly Ser He Phe Pro Tyr Arg His He Gly Ser lie 
* 165 170 175 

Ser Gin Gin Glu Tyr Arg He Val Gly Leu Tyr Arg Asn Asp Val Leu 
180 185 190 

Leu Leu Ser Thr Lys Ser Leu Val He Gin Pro Arg Asp He Leu Leu 
195 200 205 

Val Ala Gly Asn Pro Glu He Leu Asn Ala Val Tyr Leu Gin Val Lys 
210 215 220 

Ser Asn Val Gly Gin Phe Pro Ala Pro Phe Gly Lys Ser He Tyr Leu 
225 230 235 240 

Tyr He Asp Met Arg Leu Pro Lys Pro Lys Ala Met Met Pro Asp Val 
245 250 255 

Tyr Gin Ala Leu Phe Leu His Lys His Leu Lys Ser Tyr Lys Leu Tyr 
260 265 270 

He Gin Val Leu His Pro Thr Ser Pro Lys Phe Cys His Lys Phe Leu 
275 280 285 

Ser Leu Glu Thr Glu Ser He Glu Val Asn Phe Asp Phe Tyr Gly Lys 
290 295 300 

Ser Phe He Gin Lys Leu His Glu Asp His Gin Lys Lys Met Gly Leu 
305 310 315 320 

He Val Val Gly Arg Glu Leu Phe Leu Ser Lys Lys His Arg Lys Ala 
325 330 335 

Leu Tyr Lys Thr Ala Thr Pro Val Tyr Lys Thr Asn Thr Ser Gly Leu 
340 345 350 

Ser Lys Thr Ser Gin Ser Val Val Val Leu Asn Glu Ser Leu Asp He 
355 360 365 
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Asn Glu Asp Met Ser Ser Val lie Phe Asp Val Ser Met Gin Met Asp 
370 375 380 . 

Leu Gly Leu Leu Leu Tyr Asp Phe Asp Pro Asn Lys Arg Tyr Lys Asn 
385 390 395 400 

Glu lie Val Asn His Tyr Glu Asn Leu Ala Asn Thr Leu Asn Arg Lys 
405 410 415 

lie Glu lie Phe Gin Thr Asp lie Arg Asn Pro lie Met Tyr Leu Asn 
420 425 430 

Ser Leu Arg Asn Pro lie Leu His Phe Met Pro Phe Glu Glu Cys lie 
435 440 445 

Thr His Thr Arg Phe Trp Trp Phe Leu Ser Thr Lys Val Glu Lys Leu 
450 455 460 

Ala Phe Leu Asn Asp Asp Asn Pro Gin lie Phe lie Pro Val Ala Glu 
465 47u 475 480 



(2) ANGABEN ZU SEQ ID NO: 63: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 543 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT: 

(B) CLON(E) : HPC008 (HPC114, HPC145) 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE:1..543 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 63: 

ATG AAA AGC ATG CGT TTT AGC TAT ATT GAG CCA AGA GCG AAA TAC CTT 48 
Met Lys Ser Met Arg Phe Ser Tyr lie Glu Pro Arg Ala Lys Tyr Leu 
485 490 495 

ATC AGC AAG CTT TCT AAA ATT TGG GTT TTT TAC ATT TTT TTA TCT TTT 96 
lie Ser Lys Leu Ser Lys lie Trp Val Phe Tyr lie Phe Leu Ser Phe 
500 505 510 

GTG GTG ATA GGG GGG TTA GTG TGG TTT ATG CAC AAC GCC ATT AAA AGC 144 
Val Val lie Gly Gly Leu Val Trp Phe Met His Asn Ala lie Lys Ser 
515 520 525 

ACT CAA GAC AAC GCG TCC AGT TTG ACG ATC CAA GAA AGG CTC TAC CGC 192 
Thr Gin Asp Asn Ala Ser Ser Leu Thr lie Gin Glu Arg Leu Tyr Arg 
530 535 540 545 

CAT GAA ATC ATC CGC TTA CAG GTT AAG ACT GAT GAA ACC TTA AAA CTC 240 
His Glu lie lie Arg Leu Gin Val Lys Thr Asp Glu Thr Leu Lys Leu 
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550 555 560 

ATT AAA GAA GCC AAA AAG CGT TTG AAT TAT AAC GAT GAT ATA CGA GAT 288 
lie Lys Glu Ala Lys Lys Arg Leu Asn Tyr Asn Asp Asp lie Arg Asp 
565 570 575 

GTT TTG CAA GGG CTT TTG AAT ATT GTG CCG GAT TCC ATC ACT ATT AAT 336 
Val Leu Gin Gly Leu Leu Asn lie Val Pro Asp Ser lie Thr He Asn 
580 585 590 

AGC ATT GAA ATA GAC CAG CAA AGC GTA GTG GTT AGT GGT AAA ACC CCT 384 
Ser He Glu He Asp Gin Gin Ser Val Val Val Ser Gly Lys Thr Pro 
595 600 605 

TCT AAA GAA GCC TTT TAT TTT TTG TTT CAA AAC AAA CTA AAC CCC ATG 432 
Ser Lys Glu Ala Phe Tyr Phe Leu Phe Gin Asn Lys Leu Asn Pro Met 
610 615 620 625 

TTT GAT TAT TCT AGG GCG GAA TTT TTC CCT TTA AGC GAC GGG TGG TTT 4 80 

Phe Asp Tyr Ser Arg Ala Glu Phe Phe Pro Leu Ser Asp Gly Trp Phe 
630 635 640 

AAT TTT GTC TCC ACC AAC TTT TCT AAT TCC TTA CTG ATA AAA AAT CCG 528 
Asn Phe Val Ser Thr Asn Phe Ser Asn Ser Leu Leu He Lys Asn Pro 
645 650 655 

GAG TCT ATT AAA TGA 543 
Glu Ser He Lys * 
660 

(2) ANGABEN ZU SEQ ID NO: 64: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 181 Aminosauren 

(B) ART : Aminosaure 
(D) TOPOLOGIE : linear 

(ii) ART DES MOLEK&LS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 64: 

Met Lys Ser Met Arg Phe Ser Tyr He Glu Pro Arg Ala Lys Tyr Leu 
15 10 15 

He Ser Lys Leu Ser Lys He Trp Val Phe Tyr He Phe Leu Ser Phe 
20 25 30 

Val Val He Gly Gly Leu Val Trp Phe Met His Asn Ala He Lys Ser 
35 40 45 

Thr Gin Asp Asn Ala Ser Ser Leu Thr He Gin Glu Arg Leu Tyr Arg 
50 55 60 

His Glu He He Arg Leu Gin Val Lys Thr Asp Glu Thr Leu Lys Leu 
65 70 75 80 

He Lys Glu Ala Lys Lys Arg Leu Asn Tyr Asn Asp Asp He Arg Asp 
85 90 95 

Val Leu Gin Gly Leu Leu Asn He Val Pro Asp Ser He Thr He Asn 
100 105 110 
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Ser lie Glu lie Asp Gin Gin Ser Val Val Val Ser Gly Lys Thr Pro 
115 120 125 

Ser Lys Glu Ala Phe Tyr Phe Leu Phe Gin Asn Lys Leu Asn Pro Met 
130 135 140 

Phe Asp Tyr Ser Arg Ala Glu Phe Phe Pro Leu Ser Asp Gly Trp Phe 
145 150 155 160 

Asn Phe Val Ser Thr Asn Phe Ser Asn Ser Leu Leu lie Lys Asn Pro 
165 170 175 

Glu Ser lie Lys * 
180 

(2) ANGABEN ZU SEQ ID NO: 65: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 1746 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT : 
(B) CLON(E) : HPS013 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE:1..1746 



(xi) SEQUENZBES CHRE IBUNG : SEQ ID NO: 65: 

ATG AAA AAA TTG GTT TTA GTC ATC TTT TTA ACG CTA GCG CTT TCA ATA 48 
Met Lys Lys Leu Val Leu Val lie Phe Leu Thr Leu Ala Leu Ser lie 
185 190 195 

TCT GCA AAA GAA GTC AAA ATA GTG TTT TTA GAA ACT TCA GAC ATT CAT 96 
Ser Ala Lys Glu Val Lys lie Val Phe Leu Glu Thr Ser Asp lie His 
200 205 210 

GGG CGG CTT TTT TCG TAT GAT TAT GCG ATT GGC GAG CAA AAA CCC AAT 144 
Gly Arg Leu Phe Ser Tyr Asp Tyr Ala lie Gly Glu Gin Lys Pro Asn 
215 220 225 

AAC GGC TTG ACA AGG ATT GCG ACT TTA ATC AAA AAG CAA AGG GCT GAG 192 
Asn Gly Leu Thr Arg lie Ala Thr Leu lie Lys Lys Gin Arg Ala Glu 
230 235 240 245 

AAT AAA AAT GTG GTT TTG ATT GAC AGC GGG GAT TTG TTG CAA GGC AAT 240 
Asn Lys Asn Val Val Leu He Asp Ser Gly Asp Leu Leu Gin Gly Asn 
250' 255 260 

AGC GCG GAG TTG TTT AAT GAT GAG CCA ATT CAT CCG CTA GTT AGA GCT 288 
Ser Ala Glu Leu Phe Asn Asp Glu Pro He His Pro Leu Val Arg Ala 
265 270 275 

GAA AAC GAT TTG AAA TTT GAC ATT CGT GTG CTT GGC AAT CAC GAG TTT 336 
Glu Asn Asp Leu Lys Phe Asp He Arg Val Leu Gly Asn His Glu Phe 
280 285 290 
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AAT TTC AGT AAA GAT TTT TTA GAA AAG AAT ATT AAG GGG TTT AAT GGC 384 
Asn Phe Ser Lys Asp Phe Leu Glu Lys Asn He Lys Gly Phe Asn Gly 
295 300 305 

GAT GTC ATG AAT GCG AAT ATC ATT AAA ATT GCG GAG AAT AAG CCG TTT 432 
Asp Val Met Asn Ala Asn He He Lys He Ala Asp Asn Lys Pro Phe 
310 315 320 325 

GTA AAA CCT TAT ATT ATT AAA AAA ATT GAT GGC GTG AGG GTG GCG GTT 480 
Val Lys Pro Tyr He He Lys Lys He Asp Gly Val Arg Val Ala Val 
330 335 340 

GTG GGG TAT GTG GTG GCG CAC ATC CCA ACT TGG GAG GCC TCT ACG CCT 528 
Val Gly Tyr Val Val Ala His He Pro Thr Trp Glu Ala Ser Thr Pro 
345 350 355 

GAA CAT TTT GCA GGA TTG AAG TTT TTG GAC GCT GAA GAA GCG TTA AAA 576 
Glu His Phe Ala Gly Leu Lys Phe Leu Asp Ala Glu Glu Ala Leu Lys 
360 365 370 

AAG ACC TTA AAA GAG TTG AAA GGG AAG TAT GAT ATT TTG ATT GGC GCT 624 
Lys Thr Leu Lys Glu Leu Lys Gly Lys Tyr Asp He Leu He Gly Ala 
375 380 385 

TTT CAT TTG GGG CGA GAA GAT GAG AAA GGT GGC GAC GGG ATA CCG GAT 672 
Phe His Leu Gly Arg Glu Asp Glu Lys Gly Gly Asp Gly He Pro Asp 
390 395 400 405 

TTA GCG AAA AAA TTC CCG CAA TTT GAC ATC ATT TTT GCA GGG CAT GAG 720 
Leu Ala Lys Lys Phe Pro Gin Phe Asp He He Phe Ala Gly His Glu 
410 415 420 

CAT GCG GTT TAT AAC ACC AAA GTA GGG AAA GTG CAT ACC ATT GAG CCT 768 
His Ala Val Tyr Asn Thr Lys Val Gly Lys Val His Thr He Glu Pro 
425 430 435 

GGA GCG TAT GGG GCT TAT CTG GCA AAG - GGC GTG GTG GTA TTT GAC ACT 816 
Gly Ala Tyr Gly Ala Tyr Leu Ala Lys Gly Val Val Val Phe Asp Thr 
440 445 450 

AAA ACG AAG AAA AAA ATT ATA ACG ACT GAA AAT TTA CCC ACA AAA GAT 864 
Lys Thr Lys Lys Lys He He Thr Thr Glu Asn Leu Pro Thr Lys Asp 
455 460 465 

GTG CCA GAA GAT GAA GAA TTA GCG AAA AAA TAG GAA TAT GTG GAT AAA 912 
Val Pro Glu Asp Glu Glu Leu Ala Lys Lys Tyr Glu Tyr Val Asp Lys 
470 475 480 485 

AAA TCA AAA GAA TAC GCT AAT GAA GTG GTT GGC GAA GTT ACA AAA ACC 960 
Lys Ser Lys Glu Tyr Ala Asn Glu Val Val Gly Glu Val Thr Lys Thr 
490 495 500 

TTT ATT GAC AGG CCT GAT TTT ATC ACA GGA GAA GAA AAA ATC ACC ACG 1008 
Phe He Asp Arg Pro Asp Phe He Thr Gly Glu Glu Lys He Thr Thr 
505 510 515 

ATG CCC ACC GCC GCC TTG CAA GAA ACA CCG GTG ATA GAA TTG ATT AAT 1056 
Met Pro Thr Ala Ala Leu Gin Glu Thr Pro Val He Glu Leu He Asn 
520 525 530 

AAA GTG CAA AAA TAT TAC GCA AAA GCC GAT GTT TCA GCG GCA GCC TTA 1104 
Lys Val Gin Lys Tyr Tyr Ala Lys Ala Asp Val Ser Ala Ala Ala Leu 
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535 540 545 

TTC AAT TTT GGG GCG AAT TTG AAA AAA GGG CCT TTC AAA AGA AAA GAT 1152 
Phe Asn Phe Gly Ala Asn Leu Lys Lys Gly Pro Phe Lys Arg Lys Asp 
550 555 560 565 

GTC ACT TAT ATT TAC AAG TTC GCT AAT ACG CTC ATT GGA GTG CGT ATA 1200 
Val Thr Tyr lie Tyr Lys Phe Ala Asn Thr Leu lie Gly Val Arg lie 
570 575 580 

ACG GGT GAA AAT CTG TTG AAA TAC ATG GAA TGG TCA TAC CGA TTT TAC 1248 
Thr Gly Glu Asn Leu Leu Lys Tyr Met Glu Trp Ser Tyr Arg Phe Tyr 
585 590 595 

AAT CAG TTG GAA CCA GGA GAT TTG ACG ATC AGT TTT AAT GAA AAC ATT 1296 
Asn Gin Leu Gin Pro Gly Asp Leu Thr lie Ser Phe Asn Glu Asn lie 
600 605 610 

CGC GGC TAT AAC TTT GAT ATG TTT TCT GGC GTG AAA TAC CAG GTT GAT 1344 
Arg Gly Tyr Asn Phe Asp Met Phe Ser Gly Val Lys Tyr Gin Val Asp 
615 620 625 

GTT ACA AAA CCC GCC GGA CAA AGG ATT ATC AAT CCG ACA ATC AAC AAC 1392 
Val Thr Lys Pro Ala Gly Gin Arg lie lie Asn Pro Thr lie Asn Asn 
630 635 640 645 

AAA CCC ATT GAC CCC AAA GCC ATC TAT AAA TTA GCG ATC AAC AAT TAC 1440 
Lys Pro lie Asp Pro Lys Ala lie Tyr Lys Leu Ala lie Asn Asn Tyr 
650 655 660 

CGA TTC GGA ACA TTA TCC ACG ACA TTG AAT TTG GTT ACA GAC GCT GAT 1488 
Arg Phe Gly Thr Leu Ser Thr Thr Leu Asn Leu Val Thr Asp Ala Asp 
665 670 675 

AGG TAT TAT AAT TCT TAC GAT GAA CTG CAA GAT AAT GGG CAA ATA CGA 1536 
Arg Tyr Tyr Asn Ser Tyr Asp Glu Leu Gin Asp Asn Gly Gin lie Arg 
680 685 690 

GAT TTG ATC ATC AAA TAC ATC ACG GAA GAA AAA GGT GGG AAG GTA ACC 1584 
Asp Leu lie lie Lys Tyr He Thr Glu Glu Lys Gly Gly Lys Val Thr 
695 700 705 

CCT GAA TTG GAG GGT AAT TGG GAA ATC ATC AAC TAC GAT TTC AAA AAC 1632 
Pro Glu Leu Glu Gly Asn Trp Glu He He Asn Tyr Asp Phe Lys Asn 
710 715 720 725 

CCG TTG TTG GAA AAA TTG AGA GAA AAA TTA AAA GAG GGG AGC ATC AAA 1680 
Pro Leu Leu Glu Lys Leu Arg Glu Lys Leu Lys Glu Gly Ser He Lys 
730 735 740 

ATC CCC ACC TCA AAG GAT GGG AGG ACT TTG AAT GTC AAA TCC ATT AAA 1728 
He Pro Thr Ser Lys Asp Gly Arg Thr Leu Asn Val Lys Ser He Lys 
745 750 755 

GAG AGT GAA GTT AAA TAA 1746 
Glu Ser Glu Val Lys * 
760 



(2) ANGABEN ZU SEQ ID NO: 66: 
(i) SEQUENZKENNZEICHEN: 
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(A) LANGE: 582 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 66: 

Met Lys Lys Leu Val Leu Val He Phe Leu Thr Leu Ala Leu Ser He 
15 10 15 

Ser Ala Lys Glu Val Lys He Val Phe Leu Glu Thr Ser Asp He His 
20 25 30 

Gly Arg Leu Phe Ser. Tyr Asp Tyr Ala lie Gly Glu Gin Lys Pro Asn 
35 40 45 

Asn Gly Leu Thr Arg He Ala Thr Leu He Lys Lys Gin Arg Ala Glu 
50 55 60 

Asn Lys Asn Val Val Leu He Asp Ser Gly Asp Leu Leu Gin Gly Asn 
65 70 75 80 

Ser Ala Glu Leu Phe Asn Asp Glu Pro He His Pro Leu Val Arg Ala 
85 90 95 

Glu Asn Asp Leu Lys Phe Asp He Arg Val Leu Gly Asn His Glu Phe 
100 105 HO 

Asn Phe Ser Lys Asp Phe Leu Glu Lys Asn He Lys Gly Phe Asn Gly 
115 120 125 

Asp Val Met Asn Ala Asn He He Lys He Ala Asp Asn Lys Pro Phe 
130 135 140 

Val Lys Pro Tyr He He Lys Lys He Asp Gly Val Arg Val Ala Val 
145 150 155 160 

Val Gly Tyr Val Val Ala His He Pro Thr Trp Glu Ala Ser Thr Pro 
165 170 175 

Glu His Phe Ala Gly Leu Lys Phe Leu Asp Ala Glu Glu Ala Leu Lys 
180 185 190 

Lys Thr Leu Lys Glu Leu Lys Gly Lys Tyr Asp He Leu He Gly Ala 
195 200 205 

Phe His Leu Gly Arg Glu Asp Glu Lys Gly Gly Asp Gly He Pro Asp 
210 215 220 

Leu Ala Lys Lys Phe Pro Gin Phe Asp He He Phe Ala Gly His Glu 
225 230 235 240 

His Ala Val Tyr Asn Thr Lys Val Gly Lys Val His Thr He Glu Pro 
245 250 255 

Gly Ala Tyr Gly Ala Tyr Leu Ala Lys Gly Val Val Val Phe Asp Thr 
260 265 270 

Lys Thr Lys Lys Lys He He Thr Thr Glu Asn Leu Pro Thr Lys Asp 
275 280 285 

Val Pro Glu Asp Glu Glu Leu Ala Lys Lys Tyr Glu Tyr Val Asp Lys 
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290 295 300 

Lys Ser Lys Glu Tyr Ala Asn Glu Val Val Gly Glu Val Thr Lys Thr 
305 310 315 320 

Phe lie Asp Arg Pro Asp Phe lie Thr Gly Glu Glu Lys lie Thr Thr 
325 330 335 

Met Pro Thr Ala Ala Leu Gin Glu Thr Pro Val He Glu Leu He Asn 
340 345 350 

Lys Val Gin Lys Tyr Tyr Ala Lys Ala Asp Val Ser Ala Ala Ala Leu 
355 360 365 

Phe Asn Phe Gly Ala Asn Leu Lys Lys Gly Pro Phe Lys Arg Lys Asp 
370 375 380 

Val Thr Tyr He Tyr Lys Phe Ala Asn Thr Leu He Gly Val Arg He 
385 390 395 400 

Thr Gly Glu Asn Leii Leu Lys Tyr Met Glu Trp Ser Tyr Arg Phe Tyr 
405 410 415 

Asn Gin Leu Gin Pro Gly Asp Leu Thr He Ser Phe Asn Glu Asn He 
420 425 430 

Arg Gly Tyr Asn Phe Asp Met Phe Ser Gly Val Lys Tyr Gin Val Asp 
435 440 445 

Val Thr Lys Pro Ala Gly Gin Arg He He Asn Pro Thr He Asn Asn 
450 455 460 

Lys Pro He Asp Pro Lys Ala He Tyr Lys Leu Ala He Asn Asn Tyr 
465 470 475 480 

Arg Phe Gly Thr Leu Ser Thr Thr Leu Asn Leu Val Thr Asp Ala Asp 
485 490 495 

Arg Tyr Tyr Asn Ser Tyr Asp Glu Leu Gin Asp Asn Gly Gin He Arg 
500 505 510 

Asp Leu He He Lys Tyr He Thr Glu Glu Lys Gly Gly Lys Val Thr 
515 520 525 

Pro Glu Leu Glu Gly Asn Trp Glu He He Asn Tyr Asp Phe Lys Asn 
530 535 540 

Pro Leu Leu Glu Lys Leu Arg Glu Lys Leu Lys Glu Gly Ser He Lys 
545 550 555 560 

He Pro Thr Ser Lys Asp Gly Arg Thr Leu Asn Val Lys Ser He Lys 
565 570 575 

Glu Ser Glu Val Lys * 
580 

(2) ANGABEN ZU SEQ ID NO: 67: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 1698 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 
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(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT: 

(B) CLON(E) : HPS024 (HPS025) 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE:1. .1698 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 67: 

ATG ATG TTT TCT TCA ATG TTT GCT TCG TTG GGG ACT CGT ATC ATG CTG 48 
Met Met Phe Ser Ser Met Phe Ala Ser Leu Gly Thr Arg lie Met Leu 
585 590 595 

GTC GTG TTA GCC GCT CTT TTA GGT TTA GGG GGG CTT TTT ATT GGT TTT 96 
Val Val Leu Ala Ala Leu Leu Gly Leu Gly Gly Leu Phe lie Gly Phe 
600 605 610 

GTA AAG GTT ATG CAA AAA GAT GTG TTA GCG CAA CTC ATG GAG CAT TTA 144 
Val Lys Val Met Gin Lys Asp Val Leu Ala Gin Leu Met Glu His Leu 
615 620 625 630 

GAA ACC GGG CAA TAC AAA AAG CGT GAA AAA ACG CTC GCT TAC ATG ACA 192 
Glu Thr Gly Gin Tyr Lys Lys Arg Glu Lys Thr Leu Ala Tyr Met Thr 
635 640 645 

AAA ATT ATT GAA CAG GGC ATT CAT GAG TAT TAC AAA AAT TTT GAC AAT 240 
Lys He He Glu Gin Gly He His Glu Tyr Tyr Lys Asn Phe Asp Asn 
650 655 660 

GCT ACT GCA AGA AAA ATG GCG TTA GAT TAT TTC 'AAA CGC ATC AAC GAC 288 
Ala Thr Ala Arg Lys Met Ala Leu Asp Tyr Phe Lys Arg He Asn Asp 
665 670 675 

GAT AAG GGC ATG ATT TAT ATG GTG GTG GTG GAT. AAA AAC GGG GTG GTA 336 
Asp Lys Gly Met He Tyr Met Val Val Val Asp Lys Asn Gly Val Val 
680 685 690 

TTG TTT GAT CCG GTC AAT CCT AAA ACC GTA GGC CAA TCA GGG CTT GAC 384 
Leu Phe Asp Pro Val Asn Pro Lys Thr Val Gly Gin Ser Gly Leu Asp 
695 700 705 710 

GCT CAG AGC GTT GAT GGG GTG TAT TAT GTT AGG GGG TAT TTG GAG GCG 432 
Ala Gin Ser Val Asp Gly Val Tyr Tyr Val Arg Gly Tyr Leu Glu Ala 
715 720 725 

GCC AAA AAA GGG GGA GGC TAC ACT TAT TAT AAA ATG CCT AAA TAC GAT 480 
Ala Lys Lys Gly Gly Gly Tyr Thr Tyr Tyr Lys Met Pro Lys Tyr Asp 
730 735 740 

GGA GGC GTA CCG GAG AAA AAA TTC GCC TAC TCG CAT TAT GAT GAA GTT 528 
Gly Gly Val Pro Glu Lys Lys Phe Ala Tyr Ser His Tyr Asp Glu Val 
745 750 755 

TCT CAA ATG GTG ATC GCA ACG ACT TCC TAT TAC ACT GAC ATT AAC ACA 576 
Ser Gin Met Val He Ala Thr Thr Ser Tyr Tyr Thr Asp He Asn Thr 
760 765 770 



WO 00/73502 



PCT/EPOO/05024 



105 

GAA AAT AAA GCG ATC AAA GAA GGC GTG AAT AAG GTT TTT GAT GAA AAC 624 
Glu Asn Lys Ala lie Lys Glu Gly Val Asn Lys Val Phe Asp Glu Asn 
775 780 785 790 

ACC ACG AAA TTA TTC CTT TGG ATA CTG ACA GCG ACG ATA GCG CTA GTG 672 
Thr Thr Lys Leu Phe Leu Trp lie Leu Thr Ala Thr lie Ala Leu Val 
795 800 805 

GTT TTG ACG CTC ATA TAC GCT AAA TTA AGG ATC GTG AAA CGC ATT GAT 720 
Val Leu Thr Leu lie Tyr Ala Lys Leu Arg lie Val Lys Arg lie Asp 
810 815 820 

GAA CTG GTC CTT AAA ATC AAC GCT TTT AGC CGT GGG GAT AAG GAT TTG 768 
Glu Leu Val Leu Lys lie Asn Ala Phe Ser Arg Gly Asp Lys Asp Leu 
825 830 835 

AGA GCC AAA ATT GAT GTG GGT GAT CGC AAC GAT GAA ATC TCG CAA GTG 816 
Arg Ala Lys lie Asp Val Gly Asp Arg Asn Asp Glu lie Ser Gin Val 
840 845 850 

GGC CGT GGG ATC AAT TTG TTT GTG GAA AAC GCC CGC TTG ATT ATG GAA 864 
Gly Arg Gly lie Asn Leu Phe Val Glu Asn Ala Arg Leu lie Met Glu 
855 860 865 870 

GAG ATT AAA GGG ATT TCC ACC CTC AAT AAA ACT TCA ATG GAT AAA TTA 912 
Glu lie Lys Gly lie Ser Thr Leu Asn Lys Thr Ser Met Asp Lys Leu 
875 880 885 

GTC CAA ATC ACG CAA GAA ACC CAA AAG AGC ATG AAA GAT TCC TCA ACC 960 
Val Gin lie Thr Gin Glu Thr Gin Lys Ser Met Lys Asp Ser Ser Thr 
890 895 900 

ACC CTA AAT TCC GTG AAA AAT AAA GCC ACT GAT ATA GCG AGC ATG ATG 1008 
Thr Leu Asn Ser Val Lys Asn Lys Ala Thr Asp. lie Ala Ser Met Met 
905 910 915 

AAT GCT TCC ATA GAG CAA TCT CAA GGG TTA AGG AAG CGT TTG ATT GAA 1056 
Asn Ala Ser lie Glu Gin Ser Gin Gly Leu Arg Lys Arg Leu lie Glu 
920 925 930 

ACG CAA GGG CTG GTC AAA GAG AGC AAG GAT GCG ATC GGG GAT TTA TTT 1104 
Thr Gin Gly Leu Val Lys Glu Ser Lys Asp Ala lie Gly Asp Leu Phe 
935 940 945 950 

TCT CAA ATC ACA GAG AGC GCG CAC ACT GAA GAG GAA CTC TCT AGC AAA 1152 
Ser Gin He Thr Glu Ser Ala His Thr Glu Glu Glu Leu Ser Ser Lys 
955 960 965 

GTG GAG CAG CTA AGC CGT AAC GCT GAT GAT GTC AAA TCC ATT CTG GAT 1200 
Val Glu Gin Leu Ser Arg Asn Ala Asp Asp Val Lys Ser He Leu Asp 
970 975 980 

ATT ATC AAT GAT ATT GCC GAT CAA ACG AAT TTA TTA GCC CTA AAC GCT 1248 
He He Asn Asp He Ala Asp Gin Thr Asn Leu Leu Ala Leu Asn Ala 
985 990 995 

GCT ATT GAA GCC GCA AGG GCT GGC GAG CAT GGC AGA GGC TTT GCG GTG 1296 
Ala He Glu Ala Ala Arg Ala Gly Glu His Gly Arg Gly Phe Ala Val 
1000 1005 1010 

GTG GCT GAT GAA GTT AGG AAT TTA GCC GGG CGC ACT CAA AAG TCT TTA 1344 
Val Ala Asp Glu Val Arg Asn Leu Ala Gly Arg Thr Gin Lys Ser Leu 
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1015 1020 1025 1030 

GCC GAA ATC AAT TCC ACT ATC ATG GTG ATT GTC CAA GAA ATC AAT GCC 13 92 

Ala Glu lie Asn Ser Thr lie Met Val lie Val Gin Glu lie Asn Ala 
1035 1040 1045 

GTG AGT TCG CAA ATG AAT CTC AAT TCG CAA AAA ATG GAG CGT TTG AGC 1440 
Val Ser Ser Gin Met Asn Leu Asn Ser Gin Lys Met Glu Arg Leu Ser 
1050 1055 1060 

GAT ATG AGT AAA AGC GTG CAA GAA ACT TAC GAA AAA ATG AGT TCT AAT 1488 
Asp Met Ser Lys Ser Val Gin Glu Thr Tyr Glu Lys Met Ser Ser Asn 
1065 1070 1075 

TTA AGC TCA GTC GTG TCA GAC AGC AAT CAA AGC ATG GAC GAT TAC GCC 153 6 

Leu Ser Ser Val Val Ser Asp Ser Asn Gin Ser Met Asp Asp Tyr Ala 
1080 1085 1090 

AAA TCC GGA CAC CAA ATT GAA GTT ATG GTA AGC GAT TTT GCA GAG GTG 1584 
Lys Ser Gly His Gin lie Glu Val Met Val Ser Asp Phe Ala Glu Val 
1095 1100 1105 1110 

GAA AAA GTG GCT TCT AAG ACT TTA GCG GAT TCT TCA GAT ATT TTA AAC 1632 
Glu Lys Val Ala Ser Lys Thr Leu Ala Asp Ser Ser Asp lie Leu Asn 
1115 1120 1125 

ATC GCT ACG CAT GTG AGT GGA ACG ACC ATG AAT TTA GAC AAA CAA GTG 1680 
He Ala Thr His Val Ser Gly Thr Thr Met Asn Leu Asp Lys Gin Val 
1130 1135 1140 

AAT TTG TTT AAA ACT TAA 1698 
Asn Leu Phe Lys Thr * 
1145 

(2) ANGABEN ZU SEQ ID NO: 68: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE : 566 Aminosauren 

(B) ART: Amino saure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG : SEQ ID NO: 68: 

Met Met Phe Ser Ser Met Phe Ala Ser Leu Gly Thr Arg lie Met Leu 
15 10 15 

Val Val Leu Ala Ala Leu Leu Gly Leu Gly Gly Leu Phe lie Gly Phe 
20 25 30 

Val Lys Val Met Gin Lys Asp Val Leu Ala Gin Leu Met Glu His Leu 
35 40 45 

Glu Thr Gly Gin Tyr Lys Lys Arg Glu Lys Thr Leu Ala Tyr Met Thr 
50 55 60 

Lys lie lie Glu Gin Gly lie His Glu Tyr Tyr Lys Asn Phe Asp Asn 
65 70 75 80 

Ala Thr Ala Arg Lys Met Ala Leu Asp Tyr Phe Lys Arg lie Asn Asp 

85 90 95 
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Asp Lys Gly Met He Tyr Met Val Val Val Asp Lys Asn Gly Val Val 
100 105 110 

Leu Phe Asp Pro Val Asn Pro Lys Thr Val Gly Gin Ser Gly Leu Asp 
US 120 125 

Ala Gin Ser Val Asp Gly Val Tyr Tyr Val Arg Gly Tyr Leu Glu Ala 
130 135 140 

Ala Lys Lys Gly Gly Gly Tyr Thr Tyr Tyr Lys Met Pro Lys Tyr Asp 
145 150 155 160 

Glv Gly Val Pro Glu Lys Lys Phe Ala Tyr Ser His Tyr Asp Glu Val 
* 165 170 175 

Ser Gin Met Val He Ala Thr Thr Ser Tyr Tyr Thr Asp He Asn Thr 
180 185 190 

Glu Asn Lys Ala He Lys Glu Gly Val Asn Lys Val Phe Asp Glu Asn 
195 200 205 

Thr Thr Lys Leu Phe Leu Trp He Leu Thr Ala Thr He Ala Leu Val 
210 215 220 

Val Leu Thr Leu He Tyr Ala Lys Leu Arg He Val Lys Arg He Asp 
225 230 235 240 

Glu Leu Val Leu Lys He Asn Ala Phe Ser Arg Gly Asp Lys Asp Leu 
245 250 255 

Arg Ala Lys He Asp Val Gly Asp Arg Asn Asp Glu He Ser Gin Val 
260 265 270 

Gly Arg Gly He Asn Leu Phe Val Glu Asn Ala Arg Leu He Met Glu 
275 280 285 

Glu He Lys Gly He Ser Thr Leu Asn Lys Thr Ser Met Asp Lys Leu 
290 295 300 

Val Gin He Thr Gin Glu Thr Gin Lys Ser Met Lys Asp Ser Ser Thr 
305 310 315 320 

Thr Leu Asn Ser Val Lys Asn Lys Ala Thr Asp He Ala Ser Met Met 
325 330 335 

Asn Ala Ser He Glu Gin Ser Gin Gly Leu Arg Lys Arg Leu He Glu 
340 345 350 

Thr Gin Gly Leu Val Lys Glu Ser Lys Asp Ala He Gly Asp Leu Phe 
355 360 365 

Ser Gin He Thr Glu Ser Ala His Thr Glu Glu Glu Leu Ser Ser Lys 
370 375 380 

Val Glu Gin Leu Ser Arg Asn Ala Asp Asp Val Lys Ser He Leu Asp 
385 390 395 400 

He He Asn Asp He Ala Asp Gin Thr Asn Leu Leu Ala Leu Asn Ala 
405 410 415 

Ala He Glu Ala Ala Arg Ala Gly Glu His Gly Arg Gly Phe Ala Val 
420 425 430 
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Val Ala Asp Glu Val Arg Asn Leu Ala Gly Arg Thr Gin Lys Ser Leu 
435 440 445 

Ala Glu lie Asn Ser Thr lie Met Val lie Val Gin Glu He Asn Ala 
450 455 460 

Val Ser Ser Gin Met Asn Leu Asn Ser Gin Lys Met Glu Arg Leu Ser 
465 470 475 480 

Asp Met Ser Lys Ser Val Gin Glu Thr Tyr Glu Lys Met Ser Ser Asn 
485 490 495 

Leu Ser Ser Val Val Ser Asp Ser Asn Gin Ser Met Asp Asp Tyr Ala 
500 505 510 

Lys Ser Gly His Gin He Glu Val Met Val Ser Asp Phe Ala Glu Val 
515 520 525 

Glu Lys Val Ala Ser Lys Thr Leu Ala Asp Ser Ser Asp lie Leu Asn 
530 535 540 

He Ala Thr His Val Ser Gly Thr Thr Met Asn Leu Asp Lys Gin Val 
545 550 555 560 

Asn Leu Phe Lys Thr * 
565 

(2) ANGABEN ZU SEQ ID NO: 69: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 855 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: be ides 

(D) TOPOLOGIE : linear 



(vii) UNMITTELBARE HERKUNFT: 
(B) CLON(E) : HPS036 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE:1..855 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 69: 

TTG GGT ATC AAT ATG TGT TCT AAA AAA ATA AGA AAT CTC ATT TTA TGC 48 
Leu Gly He Asn Met Cys Ser Lys Lys He Arg Asn Leu He Leu Cys 
570 575 580 

TTT GGT TTT ATG TTG GGC TTG CAC GCT GAA GAA AAT ACG ACT GAA GGA 96 
Phe Gly Phe Met Leu Gly Leu His Ala Glu Glu Asn Thr Thr Glu Gly 
585 590 595 

AAT ATG ACT GAA GAA AAT ATC TCT AAA GAC GCT CCC ATT CTT TTG GAA 144 
Asn Met Thr Glu Glu Asn He Ser Lys Asp Ala Pro He Leu Leu Glu 
600 605 610 

GAA AAA CGC GCC CAA ACG CTA GAA TTT AAA GAA GAA AAG GAA GCT AAA 192 
Glu Lys Arg Ala Gin Thr Leu Glu Phe Lys Glu Glu Lys Glu Ala Lys 
615 620 625 630 
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AAG AAT ATT GAT GAA AAA AGC CTG CTT GAA GAA ATC CAT AAG AAA AAA 240 
Lys Asn lie Asp Glu Lys Ser Leu Leu Glu Glu lie His Lys Lys Lys 
635 640 645 

CGC CAA CTT TAC ATG CTC AAA GGG GAA TTG CAT GAA AAA AAT GAA TCT 288 
Arg Gin Leu Tyr Met Leu Lys Gly Glu Leu His Glu Lys Asn Glu Ser 
650 655 660 

CTC TTG TTC CAA CGA ATG GCT AAA AAT AAG AGC GGT TTT TTT ATA GGC 336 
Leu Leu Phe Gin Arg Met Ala Lys Asn Lys Ser Gly Phe Phe lie Gly 
665 670 675 

GTA ATC CTT GGC GAT ATA GGG GTT AGC GCT CAT TCT TAT GAG AAG TTT 384 
Val He Leu Gly Asp He Gly Val Ser Ala His Ser Tyr Glu Lys Phe 
680 685 690 

GAA CTT TTA AGC AAT ATT CAA GCT TCT CCT TTG TTG TAT GGC TTA AGG 432 
Glu Leu Leu Ser Asn He Gin Ala Ser Pro Leu Leu Tyr Gly Leu Arg 
695 700 705 710 

AGC GGG TAT CAA AAG TAT TTT- GCT AAC GGG ATT AGC GCC TTA CGC TTT 480 
Ser Gly Tyr Gin Lys Tyr Phe Ala Asn Gly He Ser Ala Leu Arg Phe 
715 720 725 

TAT GGG GAG TAT TTA GGG GGG GCG ATG AAA GGA TTT AAA AGC GAT TCT 528 
Tyr Gly Glu Tyr Leu Gly Gly Ala Met Lys Gly Phe Lys Ser Asp Ser 
730 735 740 

TTA GCC TCT TAT CAA ACC GCA AGC TTG AAC ATT GAT TTG TTG ATG GAT 576 
Leu Ala Ser Tyr Gin Thr Ala Ser Leu Asn He Asp Leu Leu Met Asp 
745 750 755 

AAG CCT ATT GAC AAA GAA AAA AGG TTT GCG TTA GGG ATA TTT GGA GGC 624 
Lys Pro He Asp Lys Glu Lys Arg Phe Ala Leu Gly He Phe Gly Gly 
760 765 770 

GTT GGA GTG GGG TGG AAT GGG ATG TAT CAA AAT TTA AAA GAG GTT AAA 672 
Val Gly Val Gly Trp Asn Gly Met Tyr Gin Asn Leu Lys Glu Val Lys 
775 780 785 790 

GGG TAT TCA CAG CCT AAC GCT TTT GGA TTA GTG CTA AAT TTA GGG GTG 720 
Gly Tyr Ser Gin Pro Asn Ala Phe Gly Leu Val Leu Asn Leu Gly Val 
795 800 805 

AGC ATG ACG CTT AAC CTC AAA CAC CGC TTT GAA TTA GCC TTA AAA ATG 768 
Ser Met Thr Leu Asn Leu Lys His Arg Phe Glu Leu Ala Leu Lys Met 
810 815 820 

CCT CCC TTA AAA GAA ACT TCG CAA ACC TTT TTA TAT TAT TTT AAA AGC 816 
Pro Pro Leu Lys Glu Thr Ser Gin Thr Phe Leu Tyr Tyr Phe Lys Ser 
825 830 835 

ACT AAT ATT TAT TAT ATT AGT TAC AAC TAT TTA TTG TAA 855 
Thr Asn He Tyr Tyr He Ser Tyr Asn Tyr Leu Leu * 
840 845 850 



(2) ANGABEN ZU SEQ ID NO: 70: 

(i) SEQUENZKENNZEICHEN : 

(A) LANGE: 285 Aminosauren 

(B) ART: Aminosaure 
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(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKOLS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 70: 

Leu Gly He Asn Met Cys Ser Lys Lys He Arg Asn Leu He Leu Cys 
15 10 15 

Phe Gly Phe Met Leu Gly Leu His Ala Glu Glu Asn Thr Thr Glu Gly 
20 25 30 

Asn Met Thr Glu Glu Asn He Ser Lys Asp Ala Pro He Leu Leu Glu 
35 40 45 

Glu Lys Arg Ala Gin Thr Leu Glu Phe Lys Glu Glu Lys Glu Ala Lys 
50 55 60 

Lys Asn He Asp Glu Lys Ser Leu Leu Glu Glu He His Lys Lys Lys 
65 70 75 80 

Arc? Gin Leu Tyr Met Leu Lys Gly Glu Leu His Glu Lys Asn Glu Ser 

85 90 95 

Leu Leu Phe Gin Arg Met Ala Lys Asn Lys Ser Gly Phe Phe He Gly 
100 105 HO 

Val He Leu Gly Asp He Gly Val Ser Ala His Ser Tyr Glu Lys Phe 
115 120 125 

Glu Leu Leu Ser Asn He Gin Ala Ser Pro Leu Leu Tyr Gly Leu Arg 
130 135 140 

Ser Gly Tyr Gin Lys Tyr Phe Ala Asn Gly He Ser Ala Leu Arg Phe 
145 150 155 160 

Tyr Gly Glu Tyr Leu Gly Gly Ala Met Lys Gly Phe Lys Ser Asp Ser 
165 170 175 

Leu Ala Ser Tyr Gin Thr Ala Ser Leu Asn lie Asp Leu Leu Met Asp 
180 185 190 

Lys Pro He Asp Lys Glu Lys Arg Phe Ala Leu Gly He Phe Gly Gly 
195 200 205 

Val Gly Val Gly Trp Asn Gly Met Tyr Gin Asn Leu Lys Glu Val Lys 
210 215 220 

Gly Tyr Ser Gin Pro Asn Ala Phe Gly Leu Val Leu Asn Leu Gly Val 
225 230 235 240 

Ser Met Thr Leu Asn Leu Lys His Arg Phe Glu Leu Ala Leu Lys Met 
245 250 255 

Pro Pro Leu Lys Glu Thr Ser Gin Thr Phe Leu Tyr Tyr Phe Lys Ser 
260 265 270 

Thr Asn He Tyr Tyr He Ser Tyr Asn Tyr Leu Leu * 
275 280 285 

(2) ANGABEN ZTJ SEQ ID NO: 71: 
(i) SEQUENZKENNZEICHEN: 
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(A) LANGE: 669 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE : linear 



(vii) UNMITTELBARE HERKUNFT: 
(B) CLON(E) : HPS038 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE : 1 . .669 

(xi) SEQUENZBESCHREIBUNG : SEQ ID NO: 71: 

ATG GCT GAA AAT TCT TTC AAA AAT GTT TCC ACA CAA CCC AAA GTA TTT 48 
Met Ala Glu Asn Ser Phe Lys Asn Val Ser Thr Gin Pro Lys Val Phe 
290 295 300 

TTC TTA TTG CCA GCT AAA ACC CTG TTT CTT TTA GGA GGC GTT TTT AGC 96 
Phe Leu Leu Pro Ala Lys Thr Leu Phe Leu Leu Gly Gly Val Phe Ser 
305 310 315 

GCG TTT TTT ATC CTT ATT GCT GGC TTG GTT TTT TTT GAT TAT GCT CAT 144 
Ala Phe Phe lie Leu lie Ala Gly Leu Val Phe Phe Asp Tyr Ala His 
320 325 330 

TTG ATG GAC AAT GCC ATT TTT AAT TTT GCG CGT TCA ACC CCC TTT AAT 192 
Leu Met Asp Asn Ala He Phe Asn Phe Ala Arg Ser Thr Pro Phe Asn 
335 340 345 

TCC AGC CCT ATT TTA ACT CTA ATC CTC CAA AAT ATC GCT AAT TTA GGC 240 
Ser Ser Pro He Leu Thr Leu He Leu Gin Asn He Ala Asn Leu Gly 
350 355 360 365 

TCT TCT CAA TTC GTG TTG CCT TTG AGT TTG TTG GTG GGG GTG TTT TTA 288 
Ser Ser Gin Phe Val Leu Pro Leu Ser Leu Leu Val Gly Val Phe Leu 
370 375 380 

AGC CTT TAT CGC AGA AAC TTA GTG CTT GGG GTG TGG TTT GTG TTA AGC 336 
Ser Leu Tyr Arg Arg Asn Leu Val Leu Gly Val Trp Phe Val Leu Ser 
385 390 395 

GTG ATC TTG TTT GAA GCC CTT TTA GAA TCT TTA AAA CAC CTT TTT GCA 384 
Val He Leu Phe Glu Ala Leu Leu Glu Ser Leu Lys His Leu Phe Ala 
400 405 410 

TAT TCC ATT CAG TGG CTT TCG CGC AGC GCT AAT TTC CCT AAC GCT ACT 432 
Tyr Ser He Gin Trp Leu Ser Arg Ser Ala Asn Phe Pro Asn Ala Thr 
415 420 425 

GCG CTT TCT TTA GTG CTA TTT TAT GGG TTG CTT ATT TTA TTG ATA CCC 480 
Ala Leu Ser Leu Val Leu Phe Tyr Gly Leu Leu He Leu Leu He Pro 
430 435 440 445 

CAT TTA ATC ACG CAT CAA ACG CTT AAA AAT GTT CTT TTT TAT AGC TTA 528 
His Leu He Thr His Gin Thr Leu Lys Asn Val Leu Phe Tyr Ser Leu 
450 455 460 

TTT GGT TTG ATT TTT TTA ATA GGG TTA GCA CTG ATT GTT TTA GGG GTT 576 



WO 00/73502 



PCT7EP00/05024 



112 

Phe Gly Leu lie Phe Leu lie Gly Leu Ala Leu lie Val Leu Gly Val 
465 470 475 

TCT TTC AGT AGT GTT TTA GGA GGG TTT TGT TTA GGG GCG TTA GGG GCT 624 
Ser Phe Ser Ser Val Leu Gly Gly Phe Cys Leu Gly Ala Leu Gly Ala 
480 485 490 

TGT TTT TCC ATA GGG ATT TAT TTG AGC GTG TTT CAA AAG ATC TAA 669 
Cys Phe Ser lie Gly lie Tyr Leu Ser Val Phe Gin Lys lie * 
495 500 505 



(2) ANGABEN ZTJ SEQ ID NO: 72: 

(i) SEQUENZKENNZEICHEN : 

(A) LANGE: 223 Aminosauren 

(B) ART : Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 72: 

Met Ala Glu Asn Ser Phe Lys Asn Val Ser Thr Gin Pro Lys Val Phe 
15 10 15 

Phe Leu Leu Pro Ala Lys Thr Leu Phe Leu Leu Gly Gly Val Phe Ser 
20 25 30 

Ala Phe Phe lie Leu lie Ala Gly Leu Val Phe Phe Asp Tyr Ala His 
35 40 45 

Leu Met Asp Asn Ala lie Phe Asn Phe Ala Arg Ser Thr Pro Phe Asn 
50 55 60 

Ser Ser Pro lie Leu Thr Leu lie Leu Gin Asn lie Ala Asn Leu Gly 
65 70 75 80 

Ser Ser Gin Phe Val Leu Pro Leu Ser Leu Leu Val Gly Val Phe Leu 
85 90 95 

Ser Leu Tyr Arg Arg Asn Leu Val Leu Gly Val Trp Phe Val Leu Ser 
100 105 110 

Val lie Leu Phe Glu Ala Leu Leu Glu Ser Leu Lys His Leu Phe Ala 
115 120 125 

Tyr Ser lie Gin Trp Leu Ser Arg Ser Ala Asn Phe Pro Asn Ala Thr 
130 135 140 

Ala Leu Ser Leu Val Leu Phe Tyr Gly Leu Leu lie Leu Leu lie Pro 
145 150 155 160 

His Leu lie Thr His Gin Thr Leu Lys Asn Val Leu Phe Tyr Ser Leu 
165 170 175 

Phe Gly Leu He Phe Leu He Gly Leu Ala Leu He Val Leu Gly Val 
180 185 190 

Ser Phe Ser Ser Val Leu Gly Gly Phe Cys Leu Gly Ala Leu Gly Ala 
195 200 205 

Cys Phe Ser He Gly He Tyr Leu Ser Val Phe Gin Lys He * 
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210 215 220 

(2) ANGABEN ZU SEQ ID NO: 73: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE : 804 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM : beides 

(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT : 

(B) CLON(E) : HPS039 (HPS147) 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE:1..804 



(xi) SEQUENZBESCHREIBUNG : SEQ ID NO: 73: 

ATG TCA GAA AAA GAA AGA CTG AAT GAA GTG ATC TTA GAA GAA GAA AAT 48 
Met Ser Glu Lys Glu Arg Leu Asn Glu Val He Leu Glu Glu Glu Asn 
225 230 235 

AAT GGG AGC GGC ACT AAA AAG GTG TTT TTG ATC GTG GCT ATA GCC ATT 96 
Asn Gly Ser Gly Thr Lys Lys Val Phe Leu He Val Ala He Ala He 
240 245 250 255 

ATC ATT TTA GCG GTG CTT TTA ATG GTG TTT TGG AAA AGC ACG AGA GTC 144 
He He Leu Ala Val Leu Leu Met Val Phe Trp Lys Ser Thr Arg Val 
260 265 270 

GCT CCT AAA GAG ACT TTT TTA CAA ACC GAT AGC GGC ATG CAA AAA ATA 192 
Ala Pro Lys Glu Thr Phe Leu Gin Thr Asp Ser Gly Met Gin Lys He 
275 280 285 

GGC AAC ACT AAA GAC GAG AAA AAA GAC GAT GAG TTT GAA AGC TTG AAT 240 
Gly Asn Thr Lys Asp Glu Lys Lys Asp Asp Glu Phe Glu Ser Leu Asn 
290 295 300 

TTG GAT CCT TCC AAG CAA GAA GAC AAG CTA GAC AAA GTG GCG GAT AAT 288 
Leu Asp Pro Ser Lys Gin Glu Asp Lys Leu Asp Lys Val Ala Asp Asn 
305 310 315 

GTT AAG AAG CAA GAA AAT GAT GCG TTT AAC ATG CCC ACT CAA ACC GAT 336 
Val Lys Lys Gin Glu Asn Asp Ala Phe Asn Met Pro Thr Gin Thr Asp 
320 325 330 335 

CAA ACT CAA ACG GAG ATG AAA ACA ACA GAA GAA ACG CAA GAA GCT CAA 384 
Gin Thr Gin Thr Glu Met Lys Thr Thr Glu Glu Thr Gin Glu Ala Gin 
340 345 350 

AAA GGA TTA AAA GTT GTT GAG CAC ACT AGC ACT CAA AAA GAA TCT CAA 432 
Lys Gly Leu Lys Val Val Glu His Thr Ser Thr Gin Lys Glu Ser Gin 
355 360 365 

GCT GTG GCT AAA AAA GAA ATC TCC CAT AAA AAG CCT AAA GCA ACC CCT 480 
Ala Val Ala Lys Lys Glu He Ser His Lys Lys Pro Lys Ala Thr Pro 
370 375 380 
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AAA GAT AAG GAA GCC CAT AAA GAT AAA GAT AAG CAT GCG GTT AAA GAG 528 
Lys Asp Lys Glu Ala His Lys Asp Lys Asp Lys His Ala Val Lys Glu 
385 390 395 

CTA AAA GTC AAA AAA GAA GCT CAT AAA GAA GTT CCT AAA AAA GCC AAT 576 
Leu Lys Val Lys Lys Glu Ala His Lys Glu Val Pro Lys Lys Ala Asn 
400 405 410 415 

TCT AAA ACC ACT CTT ACT AAA GGG CAT TAT TTG CAA GTG GGG GTT TTT 624 
Ser Lys Thr Thr Leu Thr Lys Gly His Tyr Leu Gin Val Gly Val Phe 
420 425 430 

GCG CAC ACG CCC AAT AAA GCC TTT TTG CAA GCG TTT AAC CAA TTC CCC 672 
Ala His Thr Pro Asn Lys Ala Phe Leu Gin Ala Phe Asn Gin Phe Pro 
435 440 445 

CAT AAG ATT GAA GAT AGG GGG TCT ACT AAA CGC TAT CTC ATA GGC CCT 720 
His Lys lie Glu Asp Arg Gly Ser Thr Lys Arg Tyr Leu He Gly Pro 
450 455 460 

TAT AAG AAT AAG CAA GAA GCC TTA ATG CAT GCT GAT GAA GTC AGC AAA 768 
Tyr Lys Asn Lys Gin Glu Ala Leu Met His Ala Asp Glu Val Ser Lys 
465 470 475 

AAG ATG ACT AAA CCG GTT GTC ATA GAA GCG CGG TAG 804 
Lys Met Thr Lys Pro Val Val lie Glu Ala Arg * 
480 485 490 

(2) ANGABEN ZU SEQ ID NO: 74: 

(i) SEQUENZKENNZEICHEN : 

(A) LANGE: 268 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 74: 

Met Ser Glu Lys Glu Arg Leu Asn Glu Val He Leu Glu Glu Glu Asn 
15 10 15 

Asn Gly Ser Gly Thr Lys Lys Val Phe Leu He Val Ala He Ala He 
20 25 30 

He He Leu Ala Val Leu Leu Met Val Phe Trp Lys Ser Thr Arg Val 
35 40 45 

Ala Pro Lys Glu Thr Phe Leu Gin' Thr Asp Ser Gly Met Gin Lys He 
50 55 60 

Gly Asn Thr Lys Asp Glu Lys Lys Asp Asp Glu Phe Glu Ser Leu Asn 
65 70 75 80 

Leu Asp Pro Ser Lys Gin Glu Asp Lys Leu Asp Lys Val Ala Asp Asn 
85 90 95 

Val Lys Lys Gin Glu Asn Asp Ala Phe Asn Met Pro Thr Gin Thr Asp 
100 105 110 

Gin Thr Gin Thr Glu Met Lys Thr Thr Glu Glu Thr Gin Glu Ala Gin 
115 120 125 
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Lys Gly Leu Lys Val Val Glu His Thr Ser Thr Gin Lys Glu Ser Gin 
130 135 140 

Ala Val Ala Lys Lys Glu lie Ser His Lys Lys Pro Lys Ala Thr Pro 
145 150 155 160 

Lys Asp Lys Glu Ala His Lys Asp Lys Asp Lys His Ala Val Lys Glu 
165 170 175 

Leu Lys Val Lys Lys Glu Ala His Lys Glu Val Pro Lys Lys Ala Asn 
180 185 190 

Ser Lys Thr Thr Leu Thr Lys Gly His Tyr Leu Gin Val Gly Val Phe 
195 200 205 

Ala His Thr Pro Asn Lys Ala Phe Leu Gin Ala Phe Asn Gin Phe Pro 
210 215 220 

His Lys lie Glu Asp Arg Gly Ser Thr Lys Arg Tyr Leu lie Gly Pro 
225 230 235 240 

Tyr Lys ..Asn Lys Gin Glu Ala Leu Met His Ala Asp Glu Val Ser Lys 
245 250 255 

Lys Met Thr Lys Pro Val Val lie Glu Ala Arg * 
260 265 

(2) ANGABEN ZU SEQ ID NO: 75: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 1545 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT : 
(B) CLON(E) : HPS040 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL : CDS 

(B) LAGE:1..1545 



(xi) SEQUENZBESCHREIBUNG : SEQ ID NO: 75: 

GTG AGG CAA GAA AAG TAT TTT CTG ACT TCT TCT TTA TCG CTT TTA TCG 48 
Val Arg Gin Glu Lys Tyr Phe Leu Thr Ser Ser Leu Ser Leu Leu Ser 
270 275 280 

TTT TTA TTA TGT CCT GCA GAA GCT TTT GAT TAT CGC TTT AGC GGT CGT 96 
Phe Leu Leu Cys Pro Ala Glu Ala Phe Asp Tyr Arg Phe Ser Gly Arg 
285 290 295 300 

GTG GAG AAC TTT TCT AAG ATT GGT TTT AAC AAT TCT CAA ATC AAT ACT 144 
Val Glu Asn Phe Ser Lys lie Gly Phe Asn Asn Ser Gin lie Asn Thr 
305 310 315 



AAA AAA GGG ATT TAT CCT ACT GAA AGT TTT ATA GAT ATT GTA ACT TTA 
Lys Lys Gly lie Tyr Pro Thr Glu Ser Phe lie Asp lie Val Thr Leu 
320 325 330 



192 
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GCG CAA GTC AAA GTC AAT TTA CTC CCT AAA GGC ACC GAA AAC CAT AGG 240 

Ala Gin Val Lys Val Asn Leu Leu Pro Lys Gly Thr Glu Asn His Arg 

335 340 345 

CTC TCT GTC TCT TTG GGT GGG GCG ATT GCA GCC ATT CCT TAT GAT AAG 2 88 

Leu Ser Val Ser Leu Gly Gly Ala He Ala Ala He Pro Tyr Asp Lys 
350 355 360 

ACT AAA TAT GAT ATT AAC CAA GCT AAC GGG AAG ATT TTT GGC TCA ATT 336 
Thr Lys Tyr Asp He Asn Gin Ala Asn Gly Lys He Phe Gly Ser He 
365 370 375 380 

GTA GAG AAT TTC ATT GGG GGC TAT CAT GGA TAC TTT TTT AAT AAG TAT 384 
Val Glu Asn Phe He Gly Gly Tyr His Gly Tyr Phe Phe Asn Lys Tyr 
385 390 395 

CTT GGC CCT GCT TAT GCG GGG ACT TCT CAA TCA GCG AGC TAT CAT GCA 432 
Leu Gly Pro Ala Tyr Ala Gly Thr Ser Gin Ser Ala Ser Tyr His Ala 
400 405 410 

AGG CCT TAT GTG GTG GAT ACC GCT TTT TTA CGA TAC GAT TAC AAA GAT 480 
Arg Pro Tyr Val Val Asp Thr Ala Phe Leu Arg Tyr Asp Tyr Lys Asp 
415 420 425 

GTT TTT GGG TTT AAG GCG GGG CGC TAT GAA GCG AAT ATT GAT TTC ATG 528 
Val Phe Gly Phe Lys Ala Gly Arg Tyr Glu Ala Asn He Asp Phe Met 
430 435 440 

AGC GGA TCG AAT CAA GGG TGG GAA GTG TAT TAT CAG CCC TAT AAG ACT 576 
Ser Gly Ser Asn Gin Gly Trp Glu Val Tyr Tyr Gin Pro Tyr Lys Thr 
445 450 455 460 

GAA ACG CAA AGG TTA AGG TTT TGG TGG TGG AGT TCT TTT GGG AGA GGT 624 
Glu Thr Gin Arg Leu Arg Phe Trp Trp Trp Ser Ser Phe Gly Arg Gly 
465 470 475 

TTA GCG TTC AAC TCT TGG ATT TAT GAG TTT TTT GCG ACG GTG CCT TAT 672 
Leu Ala Phe Asn Ser Trp He Tyr Glu Phe Phe Ala Thr Val Pro Tyr 
480 485 490 

TTG AAA AAG GGA GGC AAT CCT AAT AAC AGC AAC GAT TTC ATC AAT TAT 720 
Leu Lys Lys Gly Gly Asn Pro Asn Asn Ser Asn Asp Phe He Asn Tyr 
495 500 505 

GGC TGG CAT GGA ATC ACC ACA ACC TAT TCT TAT AAA GGT TTA GAC GCT 768 
Gly Trp His Gly He Thr Thr Thr Tyr Ser Tyr Lys Gly Leu Asp Ala 
510 515 520 

CAA TTT TTT TAT TAT TTT GCG CCT AAG ACT TAT AAC GCT CCT GGC TTT 816 
Gin Phe Phe Tyr Tyr Phe Ala Pro Lys Thr Tyr Asn Ala Pro Gly Phe 
525 530 535 540 

AAG CTG GTC TAT GAC ACG AAT AGG AAT TTT CAA AAT GTA GGC TTT CGC 864 
Lys Leu Val Tyr Asp Thr Asn Arg Asn Phe Gin Asn Val Gly Phe Arg 
545 550 555 

TCT CAA AGC ATG ATC ATG ACA ACC TTT CCT TTA TAC TAT AGA GGG TGG 912 
Ser Gin Ser Met He Met Thr Thr Phe Pro Leu Tyr Tyr Arg Gly Trp 
560 565 570 

TAT AAC CCA GAG ACA AAC ACT TAT AGT TTA GAA GAC AGC ACG CCT CAT 960 
Tyr Asn Pro Glu Thr Asn Thr Tyr Ser Leu Glu Asp Ser Thr Pro His 
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575 580 585 

GGC TCG TTG TTG GGG AGG AAT GGC GTT ACT TTA AAT ATC CGC CAG GTT 1008 
Gly Ser Leu Leu Gly Arg Asn Gly Val Thr Leu Asn He Arg Gin Val 
590 595 600 

TTT TGG TGG GAT AAT TTC AAC TGG TCC ATT GGC TTT TAT AAC ACC TTT 1056 
Phe Trp Trp Asp Asn Phe Asn Trp Ser He Gly Phe Tyr Asn Thr Phe 
605 610 615 620 

GGC AAT TCG GAC GCT TTT TTA GGC TCT CAC ACG ATG CCA AGG GGT AAT 1104 
Gly Asn Ser Asp Ala Phe Leu Gly Ser His Thr Met Pro Arg Gly Asn 
625 630 635 

AAC ACT TCC TAT ATC GGT AGT GAA ATC TCC ATA ACG ACT AGG CAT GCC 1152 
Asn Thr Ser Tyr lie Gly Ser Glu He Ser He Thr Thr Arg His Ala 
640 645 650 

GGA ATG ATT GGC TAT GAT TTT TGG GAT AAT ACG GCT TAT GAT GGG CTA 1200 
Gly Met He Gly Tyr Asp Phe Trp Asp Asn Thr Ala Tyr Asp Gly Leu 
655 660 665 

GCT GAT GCG ATC ACT AAC GCT AAC ACT TTC ACT TTT TAC ACT TCT GTT 1248 
Ala Asp Ala He Thr Asn Ala Asn Thr Phe Thr Phe Tyr Thr Ser Val 
670 675 680 

GGA GGG ATC CAT AAG CGT TTT GCA TGG CAT GTT TTT GGG CGC GTC TCT 1296 
Gly Gly He His Lys Arg Phe Ala Trp His Val Phe Gly Arg Val Ser 
685 690 695 700 

CAT GCG AAT AAA AAC GCG TTA GGG CAA GTG GGG AGG GCT AAT GAA TAT 1344 
His Ala Asn Lys Asn Ala Leu Gly Gin Val Gly Arg Ala Asn Glu Tyr 
705 710 715 

TCC TTG CAA TTC AAC GCG AGC TAT GCG TTC ACT GAA TCA ATC CTT CTT 13 92 

Ser Leu Gin Phe Asn Ala Ser Tyr Ala Phe Thr- Glu Ser He Leu Leu 
720 725 730 

AAC TTT AGG ATC ACT TAT TAT GGG GCT AGG ATC AAT AAA GGG TAT CAA 1440 
Asn Phe Arg He Thr Tyr Tyr Gly Ala Arg He Asn Lys Gly Tyr Gin 
735 740 745 

GCG GGG TAT TTT GGA GCG CCC AAA TTC AAT AAC CCT GAT GGC GAT TTT 1488 
Ala Gly Tyr Phe Gly Ala Pro Lys Phe Asn Asn Pro Asp Gly Asp Phe 
750 755 760 

AGC GCT AAT TAC CAA GAC AGA AGT TAC ATG ATG ACC AAC CTC ACG CTG 1536 
Ser Ala Asn Tyr Gin Asp Arg Ser Tyr Met Met Thr Asn Leu Thr Leu 
765 770 775 780 

AAG TTT TGA 1545 
Lys Phe * 



(2) ANGABEN ZU SEQ ID NO: 76: 

(i) SEQUEN2KENNZEICHEN : 

(A) LANGE: 515 Aminosauren 

(B) ART : Aminosaure 
(D) TOPOLOGIE: linear 
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(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 76: 

Val Arg Gin Glu Lys Tyr Phe Leu Thr Ser Ser Leu Ser Leu Leu Ser 
15 10 15 

Phe Leu Leu Cys Pro Ala Glu Ala Phe Asp Tyr Arg Phe Ser Gly Arg 
20 25 30 

Val Glu Asn Phe Ser Lys He Gly Phe Asn Asn Ser Gin He Asn Thr 
35 40 45 

Lys Lys Gly He Tyr Pro Thr Glu Ser Phe He Asp He Val Thr Leu 
50 55 60 

Ala Gin Val Lys Val Asn Leu Leu Pro Lys Gly Thr Glu Asn His Arg 
65 70 75 80 

Leu Ser Val Ser Leu Gly Gly Ala He Ala Ala He Pro Tyr Asp Lys 
85 90 95 

Thr Lys Tyr Asp He Asn Gin Ala Asn Gly Lys He Phe Gly Ser He 
100 105 HO 

Val Glu Asn Phe He Gly Gly Tyr His Gly Tyr Phe Phe Asn Lys Tyr 
115 120 125 

Leu Gly Pro Ala Tyr Ala Gly Thr Ser Gin Ser Ala Ser Tyr His Ala 
130 135 140 

Arg Pro Tyr Val Val Asp Thr Ala Phe Leu Arg Tyr Asp Tyr Lys Asp 
145 150 155 160 

Val Phe Gly Phe Lys Ala Gly Arg Tyr Glu Ala Asn He Asp Phe Met 
165 170 175 

Ser Gly Ser Asn Gin Gly Trp Glu Val Tyr Tyr Gin Pro Tyr Lys Thr 
180 185 190 

Glu Thr Gin Arg Leu Arg Phe Trp Trp Trp Ser Ser Phe Gly Arg Gly 
195 200 205 

Leu Ala Phe Asn Ser Trp He Tyr Glu Phe Phe Ala Thr Val Pro Tyr 
210 215 220 

Leu Lys Lys Gly Gly Asn Pro Asn Asn Ser Asn Asp Phe He Asn Tyr 
225 230 235 240 

Gly Trp His Gly He Thr Thr Thr Tyr Ser Tyr Lys Gly Leu Asp Ala 
245 250 255 

Gin Phe Phe Tyr Tyr Phe Ala Pro Lys Thr Tyr Asn Ala Pro Gly Phe 
260 265 270 

Lys Leu Val Tyr Asp Thr Asn Arg Asn Phe Gin Asn Val Gly Phe Arg 
275 280 285 

Ser Gin Ser Met He Met Thr Thr Phe Pro Leu Tyr Tyr Arg Gly Trp 
290 295 300 

Tyr Asn Pro Glu Thr Asn Thr Tyr Ser Leu Glu Asp Ser Thr Pro His 
305 310 315 320 
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Gly Ser Leu Leu Gly Arg Asn Gly Val Thr Leu Asn He Arg Gin Val 
325 330 335 

Phe Trp Trp Asp Asn Phe Asn Trp Ser He Gly Phe Tyr Asn Thr Phe 
340 345 350 

Gly Asn Ser Asp Ala Phe Leu Gly Ser His Thr Met Pro Arg Gly Asn 
355 360 365 

Asn Thr Ser Tyr He Gly Ser Glu He Ser He Thr Thr Arg His Ala 
370 375 380 

Glv Met He Gly Tyr Asp Phe Trp Asp Asn Thr Ala Tyr Asp Gly Leu 
385 390 395 400 

Ala Asp Ala He Thr Asn Ala Asn Thr Phe Thr Phe Tyr Thr Ser Val 
405 410 415 

Gly Gly He His Lys Arg Phe Ala Trp His Val Phe Gly Arg Val Ser 
420 425 430 

His Ala Asn Lys Asn Ala Leu Gly Gin Val Gly Arg Ala Asn Glu Tyr 
435 440 445 

Ser Leu Gin Phe Asn Ala Ser Tyr Ala Phe Thr Glu Ser He Leu Leu 
450 455 460 

Asn Phe Arg He Thr Tyr Tyr Gly Ala Arg He Asn Lys Gly Tyr Gin 
465 470 475 480 

Ala Gly Tyr Phe Gly Ala Pro Lys Phe Asn Asn Pro Asp Gly Asp Phe 
485 490 495 

Ser Ala Asn Tyr Gin Asp Arg Ser Tyr Met Met Thr Asn Leu Thr Leu 
500 505 510 

Lys Phe * 
515 

(2) ANGABEN ZU SEQ ID NO: 77; 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 912 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE : linear 



(vii) UNMITTELBARE HERKUNFT: 
(B) CLON(E) : HPS048 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE: 1.-912 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 77: 

ATG AAA AAG ATT ATT CTT GCA TGC CTT ATG GCT TTT GTG GGT GCC AAT 48 
Met Lys Lys He He Leu Ala Cys Leu Met Ala Phe Val Gly Ala Asn 
520 525 530 
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TTA AGC GCA GAG CCT AAG TGG TAT AGC AAG GCC TAC AAC AAA ACA AAC 96 
Leu Ser Ala Glu Pro Lys Trp Tyr Ser Lys Ala Tyr Asn Lys Thr Asn 
535 540 545 

ACC CAA AAA GGC TAT CTT TAT GGG AGT GGT TCA GCC ACT TCT AAA GAG 144 
Thr Gin Lys Gly Tyr Leu Tyr Gly Ser Gly Ser Ala Thr Ser Lys Glu 
550 555 560 

GCT TCT AAA CAA AAA GCG TTA GCG GAT TTA GTG GCG TCT ATT AGC GTG 192 
Ala Ser Lys Gin Lys Ala Leu Ala Asp Leu Val Ala Ser lie Ser Val 
565 570 575 

GTG GTT AAT TCC CAA ATC CAT ATT CAA AAA AGT CGT GTG GAC AAT AAG 240 
Val Val Asn Ser Gin lie His lie Gin Lys Ser Arg Val Asp Asn Lys 
580 585 590 595 

TTA AAA TCC AGC GAT TCG CAA ACG ATT AAC TTA AAG ACC GAT GAC TTG 288 
Leu Lys Ser Ser Asp Ser Gin Thr lie Asn Leu Lys Thr Asp Asp Leu 
600 605 610 

GAA TTG AAT AAT GTA GAA ATT GTC AAT CAA GAA GTG CAA AAA GGG ATC 336 
Glu Leu Asn Asn Val Glu He Val Asn Gin Glu Val Gin Lys Gly He 
615 620 625 

TAC TAC ACC AGA GTA AGG ATC AAT CAA AAC TTG TTT TTG CAG GGT TTA 384 
Tvr TVr Thr Arg Val Arg He Asn Gin Asn Leu Phe Leu Gin Gly Leu 
630 635 640 

AGG GAT AAG TAT AAC GCT CTT TAT GGG CAG TTT TCC ACC TTA ATG CCT 432 
Arg Asp Lys Tyr Asn Ala Leu Tyr Gly Gin Phe Ser Thr Leu Met Pro 
645 650 655 

AAG GTT TGT AAA GGG GTT TTT TTA CAG CAA TCC AAG AGC ATG GGG GAT 480 
Lys Val Cys Lys Gly Val Phe Leu Gin Gin Ser Lys Ser Met Gly Asp 
660 665 670 675 

TTA TTG GCT AAA GCG ATG CCT ATA GAA AGG ATT TTA AAA GCG TAT TCT 528 
Leu Leu Ala Lys Ala Met Pro He Glu Arg He Leu Lys Ala Tyr Ser 
680 685 690 

GTT CCG GTG GGT TCG TTA GAA AAT TAT GAA AAA ATC TAT TAT CAA AAC 576 
Val Pro Val Gly Ser Leu Glu Asn Tyr Glu Lys He Tyr Tyr Gin Asn 
695 700 705 

GCT TTC AAA CCT AAA GTG CAA ATC ACT TTT GAT AAC AAC GGC GAT GCG 624 
Ala Phe Lys Pro Lys Val Gin He Thr Phe Asp Asn Asn Gly Asp Ala 
7.10 715 720 

GAA ATC AAA AGC GCT CTC ATA AGC GCT TAT GCC AGA GTG CTA ACC CCT 672 
Glu He Lys Ser Ala Leu He Ser Ala Tyr Ala Arg Val Leu Thr Pro 
725 730 735 

AGT GAT GAA GAA AAA CTC TAT CAA ATC AAA AAT GAA GTT TTC ACA GAC 720 
Ser Asp Glu Glu Lys Leu Tyr Gin He Lys Asn Glu Val Phe Thr Asp 
740 745 750 755 

AGT GCT AAT GGC ATC ACG CGC ATT AGA GTG GTT GTT AGC GCG AGC GAT 768 
Ser Ala Asn Gly He Thr Arg He Arg Val Val Val Ser Ala Ser Asp 
760 765 770 

TGT CAA GGC ACG CCT GTA TTG AAT AGA AGC CTT GAA GTG GAT GAA AAG 816 
Cys Gin Gly Thr Pro Val Leu Asn Arg Ser Leu Glu Val Asp Glu Lys 



WO 00/73502 



PCT/EP00/05024 



121 

775 780 785 

AAT AAG AAT TTT GCT ATC ACG CGC TTA CAA TCT TTG CTT TAT AAA GAA 864 
Asn Lys Asn Phe Ala lie Thr Arg Leu Gin Ser Leu Leu Tyr Lys Glu 
790 795 800 

CTG AAA GAT TAT GCC AAT AAA GAA GGG CAA GGC AAT ACG GGG TTA TAA 912 
Leu Lys Asp Tyr Ala Asn Lys Glu Gly Gin Gly Asn Thr Gly Leu * 
805 810 815 

(2) ANGABEN ZU SEQ ID NO: 78: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 304 Amino saur en 

( B ) ART : Ami no s aure 
(D) TOPOLOGIE : linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 78: 

Met Lys Lys lie He Leu Ala Cys Leu Met Ala Phe Val Gly Ala Asn 
15 10 IS 

Leu Ser Ala Glu Pro Lys Trp Tyr Ser Lys Ala Tyr Asn Lys Thr Asn 
20 25 .30 

Thr Gin Lys Gly Tyr Leu Tyr Gly Ser Gly Ser Ala Thr Ser Lys Glu 
35 40 45 

Ala Ser Lys Gin Lys Ala Leu Ala Asp Leu Val Ala Ser He Ser Val 
50 55 60 

Val Val Asn Ser Gin He His He Gin Lys Ser Arg Val Asp Asn Lys 
65 70 75 80 

Leu Lys Ser Ser Asp Ser Gin Thr He Asn Leu Lys Thr Asp Asp Leu 
85 90 95 

Glu Leu Asn Asn Val Glu He Val Asn Gin Glu Val Gin Lys Gly He 
100 105 HO 

Tyr Tyr Thr Arg Val Arg He Asn Gin Asn Leu Phe Leu Gin Gly Leu 
115 120 125 

Arg Asp Lys Tyr Asn Ala Leu Tyr Gly Gin Phe Ser Thr Leu Met Pro 
130 135 140 

Lys Val Cys Lys Gly Val Phe Leu Gin Gin Ser Lys Ser Met Gly Asp 
145 150 155 160 

Leu Leu Ala Lys Ala Met Pro He Glu Arg He Leu Lys Ala Tyr Ser 
165 170 175 

Val Pro Val Gly Ser Leu Glu Asn Tyr Glu Lys He Tyr Tyr Gin Asn 
180 185 190 

Ala Phe Lys Pro Lys Val Gin He Thr Phe Asp Asn Asn Gly Asp Ala 
195 200 205 

Glu He Lys Ser Ala Leu He Ser Ala Tyr Ala Arg Val Leu Thr Pro 
210 215 220 
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Ser Asp Glu Glu Lys Leu Tyr Gin lie Lys Asn Glu Val Phe Thr Asp 
225 230 235 240 

Ser Ala Asn Gly He Thr Arg He Arg Val Val Val Ser Ala Ser Asp 
245 250 255 

Cys Gin Gly Thr Pro Val Leu Asn Arg Ser Leu Glu Val Asp Glu Lys 
260 265 270 

Asn Lys Asn Phe Ala He Thr Arg Leu Gin Ser Leu Leu Tyr Lys Glu 
275 280 285 

Leu Lys Asp Tyr Ala Asn Lys Glu Gly Gin Gly Asn Thr Gly Leu * 
290 295 300 

(2) ANGABEN ZU SEQ ID NO: 79: 

(i) SEQUENZKENNZEICHEN : 

(A) LANGE: 834 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT : 
(B) CLON(E) : HPS050 

(ix) MERKMAL: 

(A) NAME/SCHLOSSEL: CDS 

(B) LAGE:1..834 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 79: 

ATG AAA ACA AAC GGG CTT TTT AAA ATG TGG GGG CTG TTT TTA GTT TTA 48 
Met Lys Thr Asn Gly Leu Phe Lys Met Trp Gly Leu Phe Leu Val Leu 
305 310 315 320 

ATC GCT TTA GTC TTT AAT GCA TGT TCT GAT AGC CAT AAA GAA AAA AAG 96 
He Ala Leu Val Phe Asn Ala Cys Ser Asp Ser His Lys Glu Lys Lys 
325 330 335 

GAC GCT TTA GAA GTC ATT AAA CAA AGA GGG GTT TTA AAA GTG GGG GTT 144 
Asp Ala Leu Glu Val He Lys Gin Arg Gly Val Leu Lys Val Gly Val 
340 345 350 

TTT AGC GAT AAG CCT CCT TTT GGC TCT GTG GAT TCT AAA GGG AAA TAT 192 
Phe Ser Asp Lys Pro Pro Phe Gly Ser Val Asp Ser Lys Gly Lys Tyr 
355 360 365 

CAA GGC TAT GAT GTA GTT ATT GCT AAA CGC ATG GCT CTT GAT TTA TTG 240 
Gin Gly Tyr Asp Val Val He Ala Lys Arg Met Ala Leu Asp Leu Leu 
370 375 380 

GGC GAT GAA AAT AAG ATT GAG TTT ATT CCT GTA GAA GCT TCA GCT AGG 288 
Gly Asp Glu Asn Lys He Glu Phe He Pro Val Glu Ala Ser Ala Arg 
385 390 395 400 



GTG GAA TTT TTA AAA GCC AAT AAA GTG GAT ATT ATC ATG GCT AAT TTC 
Val Glu Phe Leu Lys Ala Asn Lys Val Asp He He Met Ala Asn Phe 



336 
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405 410 415 

ACG CGC ACT AAA GAA AGA GAA AAA GTC GTG GAT TTC GCT AAG CCG TAT 384 
Thr Arg Thr Lys Glu Arg Glu Lys Val Val Asp Phe Ala Lys Pro Tyr 
420 425 430 

ATG AAA GTC GCT TTA GGG GTG GTT TCT AAA GAT GGG GTC ATT AAA AAT 432 
Met Lys Val Ala Leu Gly Val Val .Ser Lys Asp Gly Val lie Lys Asn 
435 440 445 

ATA GAA GAG TTG AAA GAT AAA GAG TTG ATT GTG AAT AAA GGC ACG ACA 480 
He Glu Glu Leu Lys Asp Lys Glu Leu He Val Asn Lys Gly Thr Thr 
450 455 460 

GCG GAT TTT TAT TTC ACT AAA AAT TAC CCC AAT ATC AAG CTT TTG AAA 528 
Ala Asp Phe Tyr Phe Thr Lys Asn Tyr Pro Asn He Lys Leu Leu Lys 
465 470 475 480 

TTT GAG CAA AAT ACA GAG ACT TTT TTA GCC CTT TTA AAC AAT AAG GCT 576 
Phe Glu Gin Asn Thr Glu Thr Phe Leu Ala Leu Leu Asn Asn Lys Ala 
485 490 495 

ACC GCT CTA GCC CAT GAC AAC ACT TTA TTG CTC GCT TGG ACG AAA CAA 624 
Thr Ala Leu Ala His Asp Asn Thr Leu Leu Leu Ala Trp Thr Lys Gin 
500 505 510 

CAC CCT GAA TTT AAA TTA GGC ATT ACA AGC CTT GGC GAT AAG GAT GTG 672 
His Pro Glu Phe Lys Leu Gly He Thr Ser Leu Gly Asp Lys Asp Val 
515 520 525 

ATC GCT CCA GCG ATT AAA AAA GGC AAC CCC AAG CTT TTA GAA TGG TTG 720 
He Ala Pro Ala He Lys Lys Gly Asn Pro Lys Leu Leu Glu Trp Leu 
530 535 540 

AAT AAC GAA ATA GAT TCC CTC ATT TCT AGC GAC TTC TTA AAA GAA GCT 768 
Asn Asn Glu He Asp Ser Leu He Ser Ser Asp Phe Leu Lys Glu Ala 
545 550 555 560 

TAT CAA GAG ACT TTA GCA CCT GTT TAT GGC GAT GAA ATC AAA CCG GAA 816 
Tyr Gin Glu Thr Leu Ala Pro Val Tyr Gly Asp Glu He Lys Pro Glu 
565 570 575 

GAA ATT ATT TTT GAA TGA 834 
Glu He He Phe Glu * 
580 



(2) ANGABEN ZU SEQ ID NO: 80: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE : 278 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE : linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 80: 

Met Lys Thr Asn Gly Leu Phe Lys Met Trp Gly Leu Phe Leu Val Leu 
15 10 15 

He Ala Leu Val Phe Asn Ala Cys Ser Asp Ser His Lys Glu Lys Lys 
20 25 30 
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Asp Ala Leu Glu Val lie Lys Gin Arg Gly Val Leu Lys Val Gly Val 
35 40 . 45 

Phe Ser Asp Lys Pro Pro Phe Gly Ser Val Asp Ser Lys Gly Lys Tyr 
50 55 60 

Gin Gly Tyr Asp Val Val lie Ala Lys Arg Met Ala Leu Asp Leu Leu 
65 70 75 80 

Gly Asp Glu Asn Lys lie Glu Phe lie Pro Val Glu Ala Ser Ala Arg 
85 90 95 

Val Glu Phe Leu Lys Ala Asn Lys Val Asp lie lie Met Ala Asn Phe 
100 105 110 

Thr Arg Thr Lys Glu Arg Glu Lys Val Val Asp Phe Ala Lys Pro Tyr 
115 120 125 

Met Lys Val Ala Leu Gly Val Val Ser Lys Asp Gly Val lie Lys Asn 
130 135 140 

lie Glu Glu Leu Lys Asp Lys Glu Leu lie Val Asn Lys Gly Thr Thr 
145 150 155 160 

Ala Asp Phe Tyr Phe Thr Lys Asn Tyr Pro Asn lie Lys Leu Leu Lys 
165 170 175 

Phe Glu Gin Asn Thr Glu Thr Phe Leu Ala Leu Leu Asn Asn Lys Ala 
180 185 190 

Thr Ala Leu Ala His Asp Asn Thr Leu Leu Leu Ala Trp Thr Lys Gin 
195 200 205 

His Pro Glu Phe Lys Leu Gly lie Thr Ser Leu Gly Asp Lys Asp Val 
210 215 220 

He Ala Pro Ala He Lys Lys Gly Asn Pro Lys Leu Leu Glu Trp Leu 
225 230 235 240 

Asn Asn Glu He Asp Ser Leu He Ser Ser Asp Phe Leu Lys Glu Ala 
245 250 255 

Tyr Gin Glu Thr Leu Ala Pro Val Tyr Gly Asp Glu He Lys Pro Glu 
260 265 270 

Glu He He Phe Glu * 
275 

(2) ANGABEN ZU SEQ ID NO: 81: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 1296 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE : linear 



(vii) UNMITTELBARE HERKUNFT: 
(B) CLON(E) : HPS052 



(ix) MERKMAL: 
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(A) NAME/SCHLUSSEL: CDS 
<B) LiAGE : 1 . . 1296 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 81: 

GTG GCG TTA GCT GAA GAC GAT GGC TTT TAT ATG GGA GTG GGC TAT CAA 4 8 

Val Ala Leu Ala Glu Asp Asp Gly Phe Tyr Met Gly Val Gly Tyr Gin 
280 285 290 

ATC GGC GGC GCG CAA CAA AAT ATC GAT AAC AAA GGC AGC ACC CTA AGG 96 
lie Gly Gly Ala Gin Gin Asn lie Asp Asn Lys Gly Ser Thr Leu Arg 
295 300 305 310 

AAT AAT GTC ATT AAT AAT TTC CGC CAA GTG GGC GTG GGT ATG GCA GGG 144 
Asn Asn Val lie Asn Asn Phe Arg Gin Val Gly Val Gly Met Ala Gly 
315 320 325 

GGT AAT GGG CTT TTA GCC TTA GCG ACA AAC ACG ACC ATG GAC GCT CTT 192 
Gly Asn Gly Leu Leu Ala Leu Ala Thr Asn Thr Thr Met Asp Ala Leu 
330 335 340 

TTA GGG ATA GGC AAC CAA ATT GTC AAT ACT AAT ACA ACT GTT AGC AAC 240 
Leu Gly He Gly Asn Gin He Val Asn Thr Asn Thr Thr Val Ser Asn 
345 350 355 

AAC AAC GCA GAA TTA ACC GAG TTT AAA AAA ATA CTC CCT CAA ATT GAG 288 
Asn Asn Ala Glu Leu Thr Gin Phe Lys Lys He Leu Pro Gin He Glu 
360 365 370 

CAA CGC TTT GAA ACG AAT AAA AAC GCT TAT AGC GTT CAA GCC TTG CAA 336 
Gin Arg Phe Glu Thr Asn Lys Asn Ala Tyr Ser Val Gin Ala Leu Gin 
37&- 380 385 390 

GTG TAT TTG AGT AAT GTG CTT TAT AAC TTG GTT AAT AAT AGT AAT AAT 384 
Val Tyr Leu Ser Asn Val Leu Tyr Asn Leu Val Asn Asn Ser Asn Asn 
395 400 405 

GGC AGT AAT AAT GGA GTC GTT CCT GAA TAT GTA GGA ATT ATA AAA GTT 432 
Gly Ser Asn Asn Gly Val Val Pro Glu Tyr Val Gly He He Lys Val 
410 415 420 

CTC TAT GGT TCT CAA AAT GAA TTC AGT CTC TTA GCC ACG GAG AGT GTG 480 
Leu Tyr Gly Ser Gin Asn Glu Phe Ser Leu Leu Ala Thr Glu Ser Val 
425 430 435 

GTG CTT TTA AAC GCG CTT ACA AGG GTG AAT CTG GAT AGT AAT TCG GTG 528 
Val Leu Leu Asn Ala Leu Thr Arg Val Asn Leu Asp Ser Asn Ser Val 
440 445 450 

TTT TTA AAA GGG CTA TTA GCC CAA ATG CAG CTT TTT AAT GAC ACT TCT 576 
Phe Leu Lys Gly Leu Leu Ala Gin Met Gin Leu Phe Asn Asp Thr Ser 
455 460 465 470 

TCA GCA AAG CTA GGC CAG ATC GCA GAA AAC TTG AAG AAC GGT GGT GCA 624 
Ser Ala Lys Leu Gly Gin He Ala Glu Asn Leu Lys Asn Gly Gly Ala 
475 480 485 

GGA TCA ATG CTC CAA AAG GAT GTG AAA ACC ATC TCG GAT CGA ATC GCT 672 
Gly Ser Met Leu Gin Lys Asp Val Lys Thr He Ser Asp Arg He Ala 
490 495 500 
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ACT TAC CAA GAG AAT CTA AAA CAG CTA GGA GGG ATG CTA AAG AAT TAC 720 
Thr Tyr Gin Glu Asn Leu Lys Gin Leu Gly Gly Met Leu Lys Asn Tyr 
505 510 515 

GAT GAA CCC TAC TTG CCC CAA TTT GGG CCA GGC ACA AGC TCT CAG CAT 768 
Asp Glu Pro Tyr Leu Pro Gin Phe Gly Pro Gly Thr Ser Ser Gin Hxs 
520 525 530 

GGG GTT ATT AAT GGC TTT GGC ATT CAA GTG GGC TAT AAG CAA TTT TTT 816 
Gly Val He Asn Gly Phe Gly He Gin Val Gly Tyr Lys Gin Phe Phe 
535 540 545 550 

GGG AAC AAG CGG AAT ATA GGC TTA CGA TAT TAC GCT TTC TTT GAT TAT 864 
Gly Asn Lys Arg Asn He Gly Leu Arg Tyr Tyr Ala Phe Phe Asp Tyr 
555 560 565 

GGC TTT ACG CAA TTG GGC AGT CTT AGC AGC GCC GTT AAA GCG AAT ATC 912 
Gly Phe Thr Gin Leu Gly Ser Leu Ser Ser Ala Val Lys Ala Asn He 
570 575 580 

TTT ACT TAT GGC GCT GGC ACG GAC TTT TTA TGG AAT ATC TTT AGA AGG 960 
Phe Thr Tyr Gly Ala Gly Thr Asp Phe Leu Trp Asn He Phe Arg Arg 
585 590 595 

GTT TTT AGC GAT CAG TCC TTG AAT GTG GGG GTG TTT GGG GGC ATT CAA 1008 
Val Phe Ser Asp Gin Ser Leu Asn Val Gly Val Phe Gly Gly He Gin 
600 605 610 

ATA GCG GGT AAC ACT TGG GAT AGC TCT TTA AGA GGT CAA ATT GAA AAC 1056 
He Ala Gly Asn Thr Trp Asp Ser Ser Leu Arg Gly Gin He Glu Asn 
615 620 625 630 

TCG TTT AAA GAA TAC CCC ACT CCC ACG AAT TTC CAA TTT TTG TTT AAT 1104 
Ser Phe Lys Glu Tyr Pro Thr Pro Thr Asn Phe Gin Phe Leu Phe Asn 
635 640 645 

TTG GGT TTA AGG GCT CAT TTT GCC AGC ACC ATG CAC CGC CGG TTT TTG 1152 
Leu Gly Leu Arg Ala His Phe Ala Ser Thr Met His Arg Arg Phe Leu 
650 655 660 

AGC GCG TCT CAA AGC ATT CAG CAT GGG ATG GAA TTT GGC GTG AAA ATC 1200 
Ser Ala Ser Gin Ser He Gin His Gly Met Glu Phe Gly Val Lys He 
665 670 675 

CCG GCT ATC AAT CAA AGG TAT TTG AGG GCC AAT GGG GCT GAT GTG GAT 1248 
Pro Ala He Asn Gin Arg Tyr Leu Arg Ala Asn Gly Ala Asp Val Asp 
680 685 690 

TAC AGG CGT TTG TAT GCG TTC TAT ATC AAT TAC ACG ATA GGT TTT TAA 1296 
Tyr Arg Arg Leu Tyr Ala Phe Tyr He Asn Tyr Thr He Gly Phe * 
695 700 705 710 



(2) ANGABEN ZU SEQ ID NO: 82: 

(i) SEQUENZKENNZEICHEN : 

(A) LANGE: 432 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE : linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 82: 
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Val Ala Leu Ala Glu Asp Asp Gly Phe Tyr Met Gly Val Gly Tyr Gin 
1 5 10 15 

lie Gly Gly Ala Gin Gin Asn lie Asp Asn Lys Gly Ser Thr Leu Arg 
20 25 30 

Asn Asn Val He Asn Asn Phe Arg Gin Val Gly Val Gly Met Ala Gly 
35 40 45 

Gly Asn Gly Leu Leu Ala Leu Ala Thr Asn Thr Thr Met Asp Ala Leu 
50 55 60 

Leu Gly He Gly Asn Gin He Val Asn Thr Asn Thr Thr Val Ser Asn 
65 70 75 80 

Asn Asn Ala Glu Leu Thr Gin Phe Lys Lys He Leu Pro Gin He Glu 

85 90 95 

Gin Arg Phe Glu Thr Asn Lys Asn Ala Tyr Ser Val Gin Ala Leu Gin 
100 105 110 

Val Tyr Leu Ser Asn Val Leu Tyr Asn Leu Val Asn Asn Ser Asn Asn 
115 120 125 

Gly Ser Asn Asn Gly Val Val Pro Glu Tyr Val Gly He He Lys Val 
130 135 140 

Leu Tyr Gly Ser Gin Asn Glu Phe Ser Leu Leu Ala Thr Glu Ser Val 
145 150 155 160 

Val Leu Leu Asn Ala Leu Thr Arg Val Asn Leu Asp Ser Asn Ser Val 
165 170 175 

Phe Leu Lys Gly Leu Leu Ala Gin Met Gin Leu Phe Asn Asp Thr Ser 
180 185 190 

Ser Ala Lys Leu Gly Gin He Ala Glu Asn Leu Lys Asn Gly Gly Ala 
195 200 205 

Gly Ser Met Leu Gin Lys Asp Val Lys Thr He Ser Asp Arg He Ala 
210 215 220 

Thr Tyr Gin Glu Asn Leu Lys Gin Leu Gly Gly Met Leu Lys Asn Tyr 
225 230 235 240 

Asp Glu Pro Tyr Leu Pro Gin Phe Gly Pro Gly Thr Ser Ser Gin His 
245 250 255 

Gly Val He Asn Gly Phe Gly He Gin Val Gly Tyr Lys Gin Phe Phe 
260 265 270 

Gly Asn Lys Arg Asn He Gly Leu Arg Tyr Tyr Ala Phe Phe Asp Tyr 
275 280 285 

Gly Phe Thr Gin Leu Gly Ser Leu Ser Ser Ala Val Lys Ala Asn He 
290 295 300 

Phe Thr Tyr Gly Ala Gly Thr Asp Phe Leu Trp Asn He Phe Arg Arg 
305 310 315 320 

Val Phe Ser Asp Gin Ser Leu Asn Val Gly Val Phe Gly Gly He Gin 
325 330 335 
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lie Ala Gly Asn Thr Trp Asp Ser Ser Leu Arg Gly Gin lie Glu Asn 
340 345 350 

Ser Phe Lys Glu Tyr Pro Thr Pro Thr Asn Phe Gin Phe Leu Phe Asn 
355 360 365 

Leu Gly Leu Arg Ala His Phe Ala Ser Thr Met His Arg Arg Phe Leu 
370 375 380 

Ser Ala Ser Gin Ser lie Gin His Gly Met Glu Phe Gly Val Lys lie 
385 390 395 400 

Pro Ala lie Asn Gin Arg Tyr Leu Arg Ala Asn Gly Ala Asp Val Asp 
405 410 415 

Tyr Arg Arg Leu Tyr Ala Phe Tyr lie Asn Tyr Thr lie Gly Phe * 
420 425 430 

(2) ANGABEN ZU SEQ ID -NO: 83: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 1197 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNM I TTELBARE HERKUNFT : 
(B) CLON(E) : HPS056 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL : CDS 

(B) LAGE:1.-1197 

(xi) SEQUENZBESCHREIBUNG : SEQ ID NO: 83: 

ATG GAA TCA GTA AAA ACA GGA AAA ACA AAT AAG GTT GGC AAG AAT ACA 48 
Met Glu Ser Val Lys Thr Gly Lys Thr Asn Lys Val Gly Lys Asn Thr 
435 440 445 

GAG ATG GCT AAT ACA AAG GGA AAT AAA GAG ACT CAT TTT AAA CAA GTG 96 
Glu Met Ala Asn Thr Lys Ala Asn Lys Glu Thr His Phe Lys Gin Val 
450 455 460 

AGC GCC ATT ACA AAT ATA "ATC AGA TCA GTT GGT GGG TTT TTT ACA AAA 144 
Ser Ala lie Thr Asn lie lie Arg Ser Val Gly Gly Phe Phe Thr Lys 
465 470 475 480 

ATT GCA AAG AGA GTT AGA GGA CTT GTA AAA AAA CAC CCC AAG AAA AGC 192 
lie Ala Lys Arg Val Arg Gly Leu Val Lys Lys His Pro Lys Lys Ser 
485 490 495 

AGT GCG GCA TTA GTA GTA TTG ACC CAT ATT GCG TGC AAG AAA GCG AAA 240 
Ser Ala Ala Leu Val Val Leu Thr His lie Ala Cys Lys Lys Ala Lys 
500 505 510 

GAA TTA GAC GAT AAA GTC CAA GAT AAA TCC AAA CAA GCT GAA AAA GAA 288 
Glu Leu Asp Asp Lys Val Gin Asp Lys Ser Lys Gin Ala Glu Lys Glu 
515 520 525 
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AAT CAA ATC AAT TGG TGG AAA TAT TCA GGA TTA ACA ATA GCG GCA AGT 33 6 

Asn Gin lie Asn Trp Trp Lys Tyr Ser Gly Leu Thr lie Ala Ala Ser 
530 535 540 

TTA TTA TTA GCC GCT TGT AGC GCT GGT GAT ACT GAT AAA CAG ATA GAA 3 84 

Leu Leu Leu Ala Ala Cys Ser Ala Gly Asp Thr Asp Lys Gin lie Glu 
545 550 555 560 

CTA GAA CAA GAA AAA AAG GAA GCT GAA AAC GCT AGG GAT AGA GCG AAC 432 
Leu Glu Gin Glu Lys Lys Glu Ala Glu Asn Ala Arg Asp Arg Ala Asn 
565 570 575 

AAG AGT GGG ATA GAA CTA GAA CAA GAA AGA CAG AAA ACA AAC AAG AGT 480 
Lys Ser Gly lie Glu Leu Glu Gin Glu Arg Gin Lys Thr Asn Lys Ser 
580 585 590 

GGG ATA GAA CTC GCT AAT AGT CAA ATA AAA GCA GAA CAA GAA AGA CAA 528 
Gly lie Glu Leu Ala Asn Ser Gin lie Lys Ala Glu Gin Glu Arg Gin 
595 600 605 

AAG ACA GAA CAA GAA AAA CAA AAA GCA AAT AAG AGT GCG ATA GAG TTA 576 
Lys Thr Glu Gin Glu Lys Gin Lys Ala Asn Lys Ser Ala lie Glu Leu 
610 615 620 

GAA CAG CAA AAA CAA AAG ACC ATT AAT ACA CAA AGA GAT TTG ATT AAA 624 
Glu Gin Gin Lys Gin Lys Thr lie Asn Thr Gin Arg Asp Leu lie Lys 
625 630 635 640 

GAA CAG AAA GAT TTC ATT AAA GAA ACA GAA CAA AAT TGC CAA GAA AAT 672 
Glu Gin Lys Asp Phe He Lys Glu Thr Glu Gin Asn Cys Gin Glu Asn 
645 650 655 

CAT AAT CAA TTC TTT ATT AAA AAA TTA GGA ATT AAG GGT GGC ATT GCT 720 
His Asn Gin Phe Phe He Lys Lys Leu Gly He Lys Gly Gly lie Ala 
660 665 670 

ATA GAA GTA GAA GCT GAA TGC AAA ACC CCT AAA CCT GCA AAA ACC AAT 768 
He Glu Val Glu Ala Glu Cys Lys Thr Pro Lys Pro Ala Lys Thr Asn 
675 680 685 

CAA ACC CCT ATC CAG CCA AAA CAC CTC CCA AAC TCT AAA CAA CCT CAT 816 
Gin Thr Pro He Gin Pro Lys His Leu Pro Asn Ser Lys Gin Pro His 
690 695 700 

TCT CAA AGA GGA TCA AAA GCG CAA GAG TTT ATC GCT TAT TTG CAA AAA 864 
Ser Gin Arg Gly Ser Lys Ala Gin Glu Phe He Ala Tyr Leu Gin Lys 
705 710 715 720 

GAG CTA GAA TTT CTG CCC TAT TCG CAA AAA GCT ATC GCT AAA CAA GTG 912 
Glu Leu Glu Phe Leu Pro Tyr Ser Gin Lys Ala He Ala Lys Gin Val 
725 730 735 

AAT TTC TAT AAA CCA AGT TCT ATC GCT TAT TTA GAA CTA GAT CCT AGA 960 
Asn Phe Tyr Lys Pro Ser Ser He Ala Tyr Leu Glu Leu Asp Pro Arg 
740 745 750 

GAT TTT AAG GTT ACA GAA GAA TGG CAA AAA GAA AAT CTA AAA ATA CGC 1008 
Asp Phe Lys Val Thr Glu Glu Trp Gin Lys Glu Asn Leu Lys He Arg 
755 760 765 

TCT AAA GCT CAA GCT AAA ATG CTT GAA ATG AGG GAT TTA AAA CCA GAC 1056 
Ser Lys Ala Gin Ala Lys Met Leu Glu Met Arg Asp Leu Lys Pro Asp 
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CCA CAA GCC CAC CTT CCA ACC TCT CAA 

Pro Gin Ala His Leu Pro Thr Ser Gin 
785 790 

ATA TTT GCT GAT GTT AAT AAA GAA ATA 

lie Phe Ala Asp Val Asn Lys Glu lie 
805 

AAG AAA GCA GAA AAA GCG GGT TAT GGT 

Lys Lys Ala Glu Lys Ala Gly Tyr Gly 

820 825 
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780 

AGC CTT TTG TTC GTT CAA AAA 1104 
Ser Leu Leu Phe Val Gin Lys 
795 800 

GAA GCA GTT GCT AAT ACT GAA 1152 
Glu Ala Val Ala Asn Thr Glu 
810 815 

TAT AGT AAA AGG ATG TAG 1197 
Tyr Ser Lys Arg Met * 
830 



(2) ANGABEN ZU SEQ ID NO: 84: 

(i) SEQUENZKENNZEICHEN : 

(A) LANGE: 399 Aminosauren 

(B) ART: Ami-nosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 84: 

Met Glu Ser Val Lys Thr Gly Lys Thr Asn Lys Val Gly Lys Asn Thr 
15 10 15 

Glu Met Ala Asn Thr Lys Ala Asn Lys Glu Thr His Phe Lys Gin Val 
20 25 30 

Ser Ala lie Thr Asn lie lie Arg Ser Val Gly Gly Phe Phe Thr Lys 
35 40 45 

lie Ala Lys Arg Val Arg Gly Leu Val Lys Lys His Pro Lys Lys Ser 
50 55 60 

Ser Ala Ala Leu Val Val Leu Thr His lie Ala Cys Lys Lys Ala Lys 
65 70 75 80 

Glu Leu Asp Asp Lys Val Gin Asp Lys Ser Lys Gin Ala Glu Lys Glu 
85 90 95 

Asn Gin lie Asn Trp Trp Lys Tyr Ser Gly Leu Thr lie Ala Ala Ser 
100 105 110 

Leu Leu Leu Ala Ala Cys Ser Ala Gly Asp Thr Asp Lys Gin lie Glu 
115 120 125 

Leu Glu Gin Glu Lys Lys Glu Ala Glu Asn Ala Arg Asp Arg Ala Asn 
_~ 130 135 140 

Lys Ser Gly lie Glu Leu Glu Gin Glu Arg Gin Lys Thr Asn Lys Ser 
145 150 155 160 

Gly lie Glu Leu Ala Asn Ser Gin lie Lys Ala Glu Gin Glu Arg Gin 
165 170 175 

Lys Thr Glu Gin Glu Lys Gin Lys Ala Asn Lys Ser Ala lie Glu Leu 
180 185 190 

Glu Gin Gin Lys Gin Lys Thr He Asn Thr Gin Arg Asp Leu He Lys 
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195 200 205 

Glu Gin Lys Asp Phe lie Lys Glu Thr Glu Gin Asn Cys Gin Glu Asn 
210 215 220 

His Asn Gin Phe Phe lie Lys Lys Leu Gly lie Lys Gly Gly He Ala 
225 230 235 240 

He Glu Val Glu Ala Glu Cys Lys Thr Pro Lys Pro Ala Lys Thr Asn 
245 250 255 

Gin Thr Pro He Gin Pro Lys His Leu Pro Asn Ser Lys Gin Pro His 
260 265 270 

Ser Gin Arg Gly Ser Lys Ala Gin Glu Phe He Ala Tyr Leu Gin Lys 
275 280 285 

Glu Leu Glu Phe Leu Pro Tyr Ser Gin Lys Ala He Ala Lys Gin Val 
290 295 300 

Asn Phe Tyr Lys Pro Ser Ser He Ala Tyr Leu Glu Leu Asp Pro Arg 
305 . 310 315 320 

Asp Phe Lys Val Thr Glu Glu Trp Gin Lys Glu Asn Leu Lys He Arg 
325 330 335 

Ser Lys Ala Gin Ala Lys Met Leu Glu Met Arg Asp Leu Lys Pro Asp 
340 345 350 

Pro Gin Ala His Leu Pro Thr Ser Gin Ser Leu Leu Phe Val Gin Lys 
355 360 365 

He Phe Ala Asp Val Asn Lys Glu He Glu Ala Val Ala Asn Thr Glu 
370 375 380 

Lys Lys Ala Glu Lys Ala Gly Tyr Gly Tyr Ser Lys Arg Met * 
385 390 395 

(2) ANGABEN ZU SEQ ID NO: 85: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 1131 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT : 
(B) CLON(E) : HPS059 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE:1..H31 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 85: 

ATG AAT TTT TTT AAA ATC CTT TTA ATG GAA TTA AGA GCC ATT GTT TCT 
Met Asn Phe Phe Lys He Leu Leu Met Glu Leu Arg Ala He Val Ser 
400 405 410 415 
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CAT AAA GGC GTT TTA TTA ATC CTT ATA GGC GCT CCT TTA ATC TAT GGC 96 
His Lys Gly Val Leu Leu lie Leu lie Gly Ala Pro Leu lie Tyr Gly 
420 425 430 

TTA TTA TAC CCT TTG CCT TAT TTA AGA GAC ATC GTA ACG CAG CAA AAA 144 
Leu Leu Tyr Pro Leu Pro Tyr Leu Arg Asp lie Val Thr Gin Gin Lys 
435 440 445 

ATC GCC CTT GTA GAT GAA GAC AAT TCC TTC CTT TCT AGG CAA TTA GCC 192 
He Ala Leu Val Asp Glu Asp Asn Ser Phe Leu Ser Arg Gin Leu Ala 
450 455 460 

TTC ATG GCG CAA AGC TCC AAC GAG TTA GAA ATC GCT TTT TTT AGC CCC 240 
Phe Met Ala Gin Ser Ser Asn Glu Leu Glu He Ala Phe Phe Ser Pro 
465 470 475 

TCT ATG CTG GAA GCC AAA AAG CTT TTA AAA GAA GAA AAA ATT TAT GGG 288 
Ser Met Leu Glu Ala Lys Lys Leu Leu Lys Glu Glu Lys lie Tyr Gly 
480 485 490 495 

ATC TTG CAC ATT CCC TCT CAT TTT GAA GCC AAT ATC CAT AAA CAA GTG 336 
He Leu His He Pro Ser His Phe Glu Ala Asn He His Lys Gin Val 
500 505 510 

CCT GTA ACG ATA GAT TTT TAT GCG AAT TCC AAT TAC TTT TTG ATT TAT 384 
Pro Val Thr He Asp Phe Tyr Ala Asn Ser Asn Tyr Phe Leu He Tyr 
515 520 525 

GGT GCG TTA GCG AAT GCG GTG GTG GAG AGC ATC AAC GCT TTA AAT GAT 432 
Gly Ala Leu Ala Asn Ala Val Val Glu Ser He Asn Ala Leu Asn Asp 
530 535 540 

GAG ATA AGG TTC AAA CGC AAT GCC CAA ATA GAA GAA GCT GAA TTA GGG 480 
Glu He Arg Phe Lys Arg Asn Ala Gin He Glu Glu Ala Glu Leu Gly 
545 550 555 

ACA GAC GGG ATT AAA ATC AGG CCT ATC GCT TTA TAT AAC CCT AGT GAG 528 
Thr Asp Gly He Lys He Arg Pro He Ala Leu Tyr Asn Pro Ser Glu 
560 565 570 575 

GGG TAT TTG AAT TAC GCG CTC TCT AGC GTG TTT ATT TTC ATT TTG CAC 576 
Gly Tyr Leu Asn Tyr Ala Leu Ser Ser Val Phe He Phe He Leu His 
580 585 590 

CAG GTG ATG CTC ATT GCA AGC AGC ATG TTT ACT AGC TCC AGG CGT TTG 624 
Gin Val Met Leu He Ala Ser Ser Met Phe Thr Ser Ser Arg Axg Leu 
595 600 605 

GAA TTA GCC CTT TTA GAC AGA AAG CAA ATC GCT TTA AGG CTG TGC ACA 672 
Glu Leu Ala Leu Leu Asp Arg Lys Gin He Ala Leu Arg Leu Cys Thr 
610 615 620 

AGA CTT TTG GTG TTC ATG GGG GCG TTT AGC GTT TTT ATT TTA TGG TAT 720 
Arg Leu Leu Val Phe Met Gly Ala Phe Ser Val Phe He Leu Trp Tyr 
625 630 635 

TTT GGG GCG CTG TTT TCT TTT TAT GGG ATC GAA CGG CAT GGG AGC GCT 768 
Phe Gly Ala Leu Phe Ser Phe Tyr Gly He Glu Arg His Gly Ser Ala 
640 645 650 655 

TTA ATG GTG TTT TTG AAT AGT TTG ATT TTC ATG CTT GCA ACC TTG AGT 816 
Leu Met Val Phe Leu Asn Ser Leu He Phe Met Leu Ala Thr Leu Ser 
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660 665 670 

TTG GGG TCG TTT TTA GGC GCA TGG ATT AAA AAT GAA GCC CAC ACC ACT 864 
Leu Gly Ser Phe Leu Gly Ala Trp He Lys Asn Glu Ala His Thr Thr 
675 680 685 

CAA ATC GTT TTA ATT TCT TCT TTG CCC TTG ATT TTT ATG ATG GGT TTT 912 
Gin He Val Leu He Ser Ser Leu Pro Leu He Phe Met Met Gly Phe 
690 695 700 

GTG TGG CCT TTT GAA TCC TTG CCC TCT TAT TTA CAG GTT TTT GTT CAA 960 
Val Trp Pro Phe Glu Ser Leu Pro Ser Tyr Leu Gin Val Phe Val Gin 
705 710 715 

ATA GTG CCA GCT TAT CAT GGG ATC AGT TTG CTA GGG CGA TTG AAT CAA 1008 
He Val Pro Ala Tyr His Gly He Ser Leu Leu Gly Arg Leu Asn Gin 
720 725 730 735 

ATG CAT GCG GAA TTT ATA GAT GTT TCC TTC CAT TTT TAT GCG CTT ATT 1056 
Met His Ala Glu Phe He Asp Val Ser Phe His Phe Tyr Ala Leu He 
740 745 750 

GCG ATT TTT ATT GCG AGT TTT ATA GGG AGT GTC TTT AAA CTC AGC TCT 1104 
Ala He Phe He Ala Ser Phe He Gly Ser Val Phe Lys Leu Ser Ser 
755 760 765 

TTA AAG AAA GCT TGT GAA AAC GCT TAA 1131 
Leu Lys Lys Ala Cys Glu Asn Ala * 
770 775 

(2) ANGABEN ZU SEQ ID NO: 86: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 377 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG : SEQ ID NO: 86: 

Met Asn Phe Phe Lys He Leu Leu Met Glu Leu Arg Ala He Val Ser 
15 10 15 

His Lys Gly Val Leu Leu He Leu He Gly Ala Pro Leu He Tyr Gly 
20 25 30 

Leu Leu Tyr Pro Leu Pro Tyr Leu Arg Asp He Val Thr Gin Gin Lys 
35 40 45 

He Ala Leu Val Asp Glu Asp Asn Ser Phe Leu Ser Arg Gin Leu Ala 
50 55 60 

Phe Met Ala Gin Ser Ser Asn Glu Leu Glu He Ala Phe Phe Ser Pro 
65 70 75 80 

Ser Met Leu Glu Ala Lys Lys Leu Leu Lys Glu Glu Lys He Tyr Gly 

85 90 95 

He Leu His He Pro Ser His Phe Glu Ala Asn He His Lys Gin Val 
100 105 110 
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Pro Val Thr He Asp Phe Tyr Ala Asn Ser Asn Tyr Phe Leu He Tyr 
115 120 125 

Gly Ala Leu Ala Asn Ala Val Val Glu Ser He Asn Ala Leu Asn Asp 
130 135 140 

Glu lie Arg Phe Lys Arg Asn Ala Gin He Glu Glu Ala Glu Leu Gly 
145 150 155 160 

Thr Asp Gly He Lys He Arg Pro He Ala Leu Tyr Asn Pro Ser Glu 
165 170 175 

Gly Tyr Leu Asn Tyr Ala Leu Ser Ser Val Phe He Phe He Leu His 
180 185 190 

Gin Val Met Leu He Ala Ser Ser Met Phe Thr Ser Ser Arg Arg Leu 
195 200 205 

Glu Leu Ala Leu Leu Asp Arg Lys Gin He Ala Leu Arg Leu Cys Thr 
210 215 220 

Arg Leu Leu Val Phe Met Gly Ala Phe Ser Val Phe He Leu Trp Tyr 
225 230 235 240 

Phe Gly Ala Leu Phe Ser Phe Tyr Gly He Glu Arg His Gly Ser Ala 
245 250 255 

Leu Met Val Phe Leu Asn Ser Leu He Phe Met Leu Ala Thr Leu Ser 
260 265 270 

Leu Gly Ser Phe Leu Gly Ala Trp He Lys Asn Glu Ala His Thr Thr 
275 280 285 

Gin He Val Leu He Ser Ser Leu Pro Leu He Phe Met Met Gly Phe 
290 295 300 

Val Trp Pro Phe Glu Ser Leu Pro Ser Tyr Leu Gin Val Phe Val Gin 
305 310 315 320 

He Val Pro Ala Tyr His Gly He Ser Leu Leu Gly Arg Leu Asn Gin 
325 330 335 

Met His Ala Glu Phe He Asp Val Ser Phe His Phe Tyr Ala Leu He 
340 345 350 

Ala He Phe He Ala Ser Phe He Gly Ser Val Phe Lys Leu Ser Ser 
355 360 365 

Leu Lys Lys Ala Cys Glu Asn Ala * 
370 375 

(2) ANGABEN ZU SEQ ID NO: 87: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 516 Basenpaare 

(B) ART: Nucleotid 

( C ) STRANGFORM : beides 

(D) TOPOLOGIE: linear 



(vii) UNMI TTELBARE HERKUNFT: 
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(B) CLON(E) : HPS063 

(ix) MERKMAL: 

(A) NAME/ SCHLUSSEL : CDS 

(B) LAGE:1..516 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 87: 

ATG TTT GTA GTT AAA ATG GTG TTA GGG TTT TTG ATC CTT TTA AGC CCT 48 
Met Phe Val Val Lys Met Val Leu Gly Phe Leu He Leu Leu Ser Pro 
380 385 390 

TTG TGC GCT ACT GGA TTG GAT ATT TCA CAA ACA GAT ATT ATA GAG CGT 96 
Leu Cys Ala Thr Gly Leu Asp He Ser Gin Thr Asp He He Glu Arg 
395 400 405 

TCT TTA AAT TTC CTT TTA TTT GTG GGG ATT TTG TGG TAT TTT TCG GCT 144 
Ser Leu Asn Phe Leu Leu Phe Val Gly He Leu Trp Tyr Phe Ser Ala 
410 415 420 425 

AAA AAA CTG CGT TCA TTT TTA CGC TCC AAA AGT CTT GAA ATC TCC AAA 192 
Lys Lys Leu Arg Ser Phe Leu Arg Ser Lys Ser Leu Glu He Ser Lys 
430 435 440 

CGC TTA GAA GAG ATT CAA GCC CAA CTC AAA GTG AGT AAA GAA AAT AAG 240 
Arg Leu Glu Glu He Gin Ala Gin Leu Lys Val Ser Lys Glu Asn Lys 
445 450 455 

AAA AAA CTC TTA AAA GAA TTA GAG CAA GCC AAA GAA AAA GCG GAA TTG 288 
Lys Lys Leu Leu Lys Glu Leu Glu Gin Ala Lys Glu Lys Ala Glu Leu 
460 465 470 

ATT GTT TCT GAT GCG AAT AAA GAA GCT TAC ATG ATC ACG CAA AAA TAC 336 
He Val Ser Asp Ala Asn Lys Glu Ala Tyr Met He Thr Gin Lys Tyr 
475 480 485 

GAA TTG CAA ACC AAA ATG GAT GTG GAA AAT TTG ATC AAA AAT TCT AAG 384 
Glu Leu Gin Thr Lys Met Asp Val Glu Asn Leu He Lys Asn Ser Lys 
490 495 500 505 

GCG TTG ATG GAT TTA GAA GTT AAA AAG ATC AAA AGA GAG CTG GTT GAA 432 
Ala Leu Met Asp Leu Glu Val Lys Lys He Lys Arg Glu Leu Val Glu 
510 515 520 

AGC GTT TTT AAA GAT CTA AGA GAG AGC AAA AAA GTC TCT TTC AAT GCG 480 
Ser Val Phe Lys Asp Leu Arg Glu Ser Lys Lys Val Ser Phe Asn Ala 
525 530 535 

CAA GAT TGC GTG AAT ATT TTG AAA CAA AGG CTT TAA 516 
Gin Asp Cys Val Asn He Leu Lys Gin Arg Leu * 
540 545 



(2) ANGABEN ZU SEQ ID NO: 88: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 172 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 



(ii) ART DES MOLEKULS : Protein 
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(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 88: 

Met Phe Val Val Lys Met Val Leu Gly Phe Leu He Leu Leu Ser Pro 
15 10 15 

Leu Cys Ala Thr Gly Leu Asp He Ser Gin Thr Asp He He Glu Arg 
20 25 30 

Ser Leu Asn Phe Leu Leu Phe Val Gly He Leu Trp Tyr Phe Ser Ala 
35 40 45 

Lys Lys Leu Arg Ser Phe Leu Arg Ser Lys Ser Leu Glu He Ser Lys 
50 55 60 

Arg Leu Glu Glu He Gin Ala Gin Leu Lys Val Ser Lys Glu Asn Lys 
65 70 75 80 

Lys Lys Leu Leu Lys Glu Leu Glu Gin Ala Lys Glu Lys Ala Glu Leu 
85 90 95 

He Val Ser Asp Ala Asn Lys Glu Ala Tyr Met He Thr Gin Lys Tyr 
100 105 110 

Glu Leu Gin Thr Lys Met Asp Val Glu Asn Leu He Lys Asn Ser Lys 
115 120 125 

Ala Leu Met Asp Leu Glu Val Lys Lys He Lys Arg Glu Leu Val Glu 
130 135 140 

Ser Val Phe Lys Asp Leu Arg Glu Ser Lys Lys Val Ser Phe Asn Ala 
145 150 155 160 

Gin Asp Cys Val Asn He Leu Lys Gin Arg Leu * 
165 170 

(2) ANGABEN ZU SEQ ID NO: 89: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 990 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE : linear 



(vii) UNMITTELBARE HERKUNFT: 
(B) CLON(E) : HPS069 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE:1..990 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 89: 

ATG TCA AAT AGC ATG TTG GAT AAA AAT AAA GCG ATT CTT ACA GGG GGT 48 
Met Ser Asn Ser Met Leu Asp Lys Asn Lys Ala He Leu Thr Gly Gly 
17S 180 185 

GGG GCT TTA TTG TTA GGG CTA ATC GTG CTT TTT TAT TTG GCT TAT CGC 96 
Gly Ala Leu Leu Leu Gly Leu He Val Leu Phe Tyr Leu Ala Tyr Arg 
190 195 200 
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CCT AAG GCT GAA GTG TTG CAA GGA TTT TTG GAA GCC AGA GAA TAC AGC 144 
Pro Lys Ala Glu Val Leu Gin Gly Phe Leu Glu Ala Arg Glu Tyr Ser 
205 210 215 220 

GTG AGT TCC AAA GTC CCT GGC CGC ATT GAA AAG GTG TTT GTT AAA AAA 192 
Val Ser Ser Lys Val Pro Gly Arg He Glu Lys Val Phe Val Lys Lys 
225 230 235 

GGC GAT CGC ATT AAA AAG GGC GAT TTG GTT TTT AGC ATT TCT AGC CCT 240 
Gly Asp Arg He Lys Lys Gly Asp Leu Val Phe Ser lie Ser Ser Pro 
240 245 250 

GAA TTA GAA GCC AAG CTC GCT CAA GCT GAA GCC GGG CAT AAA GCC GCT 288 
Glu Leu Glu Ala Lys Leu Ala Gin Ala Glu Ala Gly His Lys Ala Ala 
255 260 265 

AAA GCG CTT AGC GAT GAA GTC AAA AGA GGC TCA AGA GAC GAA ACG ATC 336 
Lys Ala Leu Ser Asp Glu Val Lys Arg Gly Ser Arg Asp Glu Thr He 
270 275 280 

AAT TCT GCA AGA GAC GTT TGG CAA GCG GCC AAA TCT CAA GCC ACT TTA 384 
Asn Ser Ala Arg Asp Val Trp Gin Ala Ala Lys Ser Gin Ala Thr Leu 
285 290 295 300 

GCC AAA GAG ACT TAT AAG CGC GTT CAA GAT TTG TAT GAT AAT GGC GTG 432 
Ala Lys Glu Thr Tyr Lys Arg Val Gin Asp Leu Tyr Asp Asn Gly Val 
305 310 315 

GCG AGC TTG CAA AAG CGC GAT GAA GCC TAT GCG GCT TAT GAA AGC ACT 480 
Ala Ser Leu Gin Lys Arg Asp Glu Ala Tyr Ala Ala Tyr Glu Ser Thr 
320 325 330 

AAA TAC AAC GAG AGC GCG GCT TAC CAA AAG TAT AAA ATG GCT TTA GGG 528 
Lys Tyr Asn Glu Ser Ala Ala Tyr Gin Lys Tyr Lys Met Ala Leu Gly 
335 340 345 

GGG GCG AGC TCT GAA AGT AAG ATT GCC GCT AAG GCT AAA GAG AGC GCG 576 
Gly Ala Ser Ser Glu Ser Lys He Ala Ala Lys Ala Lys Glu Ser Ala 
350 355 360 

GCT TTA GGG CAA GTG AAT GAA GTG GAG TCT TAT TTA AAA GAT GTC AAA 624 
Ala Leu Gly Gin Val Asn Glu Val Glu Ser Tyr Leu Lys Asp Val Lys 
365 370 375 380 

GCG ACA GCC CCA ATT GAT GGG GAA GTG AGT AAT GTG CTT TTA AGC GGT 672 
Ala Thr Ala Pro He Asp Gly Glu Val Ser Asn Val Leu Leu Ser Gly 
385 390 395 

GGC GAG CTT AGC CCT AAG GGC TTT CCT GTG GTG CTC ATG ATT GAT TTA 720 
Gly Glu Leu Ser Pro Lys Gly Phe Pro Val Val Leu Met He Asp Leu 
400 405 410 

AAG GAT AGT TGG TTA AAA ATC AGC GTG CCT GAA AAG TAT TTG AAC GAT 768 
Lys Asp Ser Trp Leu Lys He Ser Val Pro Glu Lys Tyr Leu Asn Asp 
415 420 425 

TTT AAA GTG GGT AAG GAA TTT GAA GGT TAT ATC CCG GCG TTG AAA AGA 816 
Phe Lys Val Gly Lys Glu Phe Glu Gly Tyr He Pro Ala Leu Lys Arg 
430 435 440 

AGC GCG AAA TTC AGG GTC AAA TAT TTG AGC GTG ATG GGG GAT TTT GCG 864 
Ser Ala Lys Phe Arg Val Lys Tyr Leu Ser Val Met Gly Asp Phe Ala 
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445 450 455 460 

ACT TGG AAA GCG ACG AAT AAT TCC AAC ACT TAC GAC ATG AAA AGC TAT 912 
Thr Trp Lys Ala Thr Asn Asn Ser Asn Thr Tyr Asp Met Lys Ser Tyr 
465 470 475 

GAA GTG GAG GCC ATA CCC TTA GAA GAG TTG GAA AAT TTT AGG GTA GGG 960 
Glu Val Glu Ala lie Pro Leu Glu Glu Leu Glu Asn Phe Arg Val Gly 
480 485 490 

ATG AGC GTG TTA GTT ACC ATT AAA CCT TAA 990 
Met Ser Val Leu Val Thr He Lys Pro * 
495 500 



(2) ANGABEN ZU SEQ ID NO: 90: 

(i) SEQTJENZKENNZEICHEN: 

(A) LANGE: 330 Aminosauren 

(B) ART: Aminos aure 
(D) TOPOLOGIE : linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 90: 

Met Ser Asn Ser Met Leu Asp Lys Asn Lys Ala He Leu Thr Gly Gly 
15 10 15 

Gly Ala Leu Leu Leu Gly Leu He Val Leu Phe Tyr Leu Ala Tyr Arg 
20 25 30 

Pro Lys Ala Glu Val Leu Gin Gly Phe Leu Glu Ala Arg Glu Tyr Ser 
35 40 45 

Val Ser Ser Lys Val Pro Gly Arg He Glu Lys Val Phe Val Lys Lys 
50 55 60 

Gly Asp Arg He Lys Lys Gly Asp Leu Val Phe Ser He Ser Ser Pro 
65 70 75 80 

Glu Leu Glu Ala Lys Leu Ala Gin Ala Glu Ala Gly His Lys Ala Ala 
85 90 95 

Lys Ala Leu Ser Asp Glu Val Lys Arg Gly Ser Arg Asp Glu Thr He 
100 105 110 

Asn Ser Ala Arg Asp Val Trp Gin Ala Ala Lys Ser Gin Ala Thr Leu 
115 120 125 

Ala Lys Glu Thr Tyr Lys Arg Val Gin Asp Leu Tyr Asp Asn Gly Val 
130 135 140 

Ala Ser Leu Gin Lys Arg Asp Glu Ala Tyr Ala Ala Tyr Glu Ser Thr 
145 150 155 160 

Lys Tyr Asn Glu Ser Ala Ala Tyr Gin Lys Tyr Lys Met Ala Leu Gly 
165 170 175 

Gly Ala Ser Ser Glu Ser Lys He Ala Ala Lys Ala Lys Glu Ser Ala 
180 185 190 

Ala Leu Gly Gin Val Asn Glu Val Glu Ser Tyr Leu Lys Asp Val Lys 
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195 



200 



205 



Ala 



Thr 
210 



Ala 



Pro lie Asp 



Gly Glu Val Ser Asn Val Leu Leu Ser Gly 
215 220 



Gly Glu Leu Ser Pro Lys Gly Phe Pro Val Val Leu Met lie Asp Leu 
225 230 235 240 

Lys Asp Ser Trp Leu Lys lie Ser Val Pro Glu Lys Tyr Leu Asn Asp 
245 250 255 

Phe Lys Val Gly Lys Glu Phe Glu Gly Tyr lie Pro Ala Leu Lys Arg 
260 265 270 

Ser Ala Lys Phe Arg Val Lys Tyr Leu Ser Val Met Gly Asp Phe Ala 
275 280 285 

Thr Trp Lys Ala Thr Asn Asn Ser Asn Thr Tyr Asp Met Lys Ser Tyr 
290 295 300 

Glu Val Glu Ala lie Pro Leu Glu Glu Leu Glu Asn Phe Arg Val Gly 
305 310 315 320 

Met Ser Val Leu Val Thr lie Lys Pro * 
325 330 

(2) ANGABEN ZU SEQ ID NO: 91: 

( i ) SEQUENZKENNZE I CHEN : 

(A) LANGE: 684 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT : 
(B) CLON(E) : HPS091 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE:1..684 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 91: 

ATG GTA TTT GAC AGA ACA ATC AGC GTA AGA GAA AAA AAA GCG GCT AAA 48 
Met Val Phe Asp Arg Thr lie Ser Val Arg Glu Lys Lys Ala Ala Lys 
335 340 345 

ACG CTT GGG ATT ATT GGG ATC GTC TTT TTT ATT TTG TTT GGC ATC GTG 96 
Thr Leu Gly lie lie Gly lie Val Phe Phe lie Leu Phe Gly lie Val 
350 355 360 

ATA AGC GGG GTG GCT TTT CAA AAA GAG TGG GTG CAA CAA TTG GAT TTA 144 
lie Ser Gly Val Ala Phe Gin Lys Glu Trp Val Gin Gin Leu Asp Leu 
365 370 375 

TTT TTT ATA GAC TTG ATC CGC AAC CCT GCC CCC ATT CAA AAA AGC GCG 192 
Phe Phe lie Asp Leu lie Arg Asn Pro Ala Pro lie Gin Lys Ser Ala 



380 



385 



390 
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TGG CTT TCT TTC GTG TTT TTT AGC ACT TGG TTT GCA CAA AGC AAG CTC 240 
Trp Leu Ser Phe Val Phe Phe Ser Thr Trp Phe Ala Gin Ser Lys Leu 
395 400 405 410 

ACC ACT CCT ATA GCC TTA CTC ATT GGC TTG TGG TTT GGG TTT CAA AAA 288 
Thr Thr Pro lie Ala Leu Leu He Gly Leu Trp Phe Gly Phe Gin Lys 
415 420 425 

CGC ATC GCT TTG GGG GTG TGG TTT TTC TTT AGC ATC TTA TTA GGT GAA 336 
Arg He Ala Leu Gly Val Trp Phe Phe Phe Ser He Leu Leu Gly Glu 
430 435 440 

TTC ACC TTA AAA TCC CTT AAG CTT TTA GTG GCG CGC CCA CGG CCT GTA 384 
Phe Thr Leu Lys Ser Leu Lys Leu Leu Val Ala Arg Pro Arg Pro Val 
445 450 455 

ACC AAT GGC GAA TTG GTT TTC GCG CAT GGC TTT AGT TTC CCT AGC GGG 432 
Thr Asn Gly Glu Leu Val Phe Ala His Gly Phe Ser Phe Pro Ser Gly 
460 465 470 

CAT GCT TTG GCT TCA GCG CTT TTT TAC GGC TCT TTG GCG TTG TTG TTA 480 
His Ala Leu Ala Ser Ala Leu Phe Tyr Gly Ser Leu Ala Leu Leu Leu 
475 480 485 490 

TGC TAT TCT AAC GCC AAC AAT CGC ATT AAA ACG ATT ATT GCT GTG GTT 528 
Cys Tyr Ser Asn Ala Asn Asn Arg He Lys Thr He He Ala Val Val 
495 500 505 

TTG CTT TTT TGG ATT TTT TTA ATG GCG TAT GAT AGG GTT TAT TTA GGG 576 
Leu Leu Phe Trp He Phe Leu Met Ala Tyr Asp Arg Val Tyr Leu Gly 
510 515 520 

GTG CAT TAC CCT AGC GAT GTT TTA GGA GGG TTT TTA TTA GGG ATT GCT 624 
Val His Tyr Pro Ser Asp Val Leu Gly Gly Phe Leu Leu Gly He Ala 
525 530 535 

TGG TCG TGC TGC TCT TTA GCG CTT TAT TTA GGG TTT TTG AAA CGC CCT 672 
Trp Ser Cys Cys Ser Leu Ala Leu Tyr Leu Gly Phe Leu Lys Arg Pro 
540 545 550 

TAT AAT CAA TAA 684 

Tyr Asn Gin * 

555 



(2) ANGABEN ZU SEQ ID NO: 92: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 228 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 92: . 

Met Val Phe Asp Arg Thr He Ser Val Arg Glu Lys Lys Ala Ala Lys 
15 10 15 

Thr Leu Gly He He Gly He Val Phe Phe He Leu Phe Gly He Val 
20 25 30 

He Ser Gly Val Ala Phe Gin Lys Glu Trp Val Gin Gin Leu Asp Leu 
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35 40 45 

Phe Phe lie Asp Leu lie Arg Asn Pro Ala Pro He Gin Lys Ser Ala 
50 55 60 

Trp Leu Ser Phe Val Phe Phe Ser Thr Trp Phe Ala Gin Ser Lys Leu 
65 70 75 80 

Thr Thr Pro He Ala Leu Leu He Gly Leu Trp Phe Gly Phe Gin Lys 
85 90 95 

Arg He Ala Leu Gly Val Trp Phe Phe Phe Ser He Leu Leu Gly Glu 
100 105 HO 

Phe Thr Leu Lys Ser Leu Lys Leu Leu Val Ala Arg Pro Arg Pro Val 
115 120 125 

Thr Asn Gly Glu Leu Val Phe Ala His Gly Phe Ser Phe Pro Ser Gly 
130 135 140 

His Ala Leu Ala Ser Ala Leu Phe Tyr Gly Ser Leu Ala Leu Leu Leu 
145 150 155 160 

Cys Tyr Ser Asn Ala Asn Asn Arg He Lys Thr He He Ala Val Val 
165 170 175 

Leu Leu Phe Trp He Phe Leu Met Ala Tyr Asp Arg Val Tyr Leu Gly 
180 185 190 

Val His Tyr Pro Ser Asp Val Leu Gly Gly Phe Leu Leu Gly He Ala 
195 200 205 

Trp Ser Cys Cys Ser Leu Ala Leu Tyr Leu Gly Phe Leu Lys Arg Pro 
210 215 220 

Tyr Asn Gin * 
225 

(2) ANGABEN ZU SEQ ID NO: 93: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 729 Basenpaare 

(B) ART: Nucleotid 

(C) STRANG FORM : beides 

(D) TOPOLOGIE : linear 



(vii) UNMITTELBARE HERKUNFT : 
(B) CLON(E) : HPS095 

(ix) MERKMAL: 

(A) NAME/ SCHLUSSEL : CDS 

(B) LAGE:1..72 9 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 93: 

ATG AAA AAA ATT TTT TCT CAA TCT TTG TTA GCT TTG GTT GTT TCT GTC 48 
Met Lys Lys He Phe Ser Gin Ser Leu Leu Ala Leu Val Val Ser Val 
230 235 240 
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AAT GCG CTA CTA GCT ATG GAT GGT AAT GGC GTG TTT ATA GGG GCG GGT 96 
Asn Ala Leu Leu Ala Met Asp Gly Asn Gly Val Phe lie Gly Ala Gly 
245 250 255 260 

TAT TTG CAA GGA CAA GCC CAA ATG CAT GCG GAT ATT AAT TCT CAA AAA 144 
Tyr Leu Gin Gly Gin Ala Gin Met His Ala Asp lie Asn Ser Gin Lys 
265 270 275 

CAA GCC ACT AGC GCT ACT ATC AAG GGG TTT GAT GCG CTT TTA GGG TAT 192 
Gin Ala Thr Ser Ala Thr lie Lys Gly Phe Asp Ala Leu Leu Gly Tyr 
280 285 290 

GAG TTT TTC TTT GGG AAA TAC TTT GGC TTA CGC CTT TAT GGG TTT TTT 240 
Gin Phe Phe Phe Gly Lys Tyr Phe Gly Leu Arg Leu Tyr Gly Phe Phe 
295 300 305 

GAC TAC GCC CAT GCC AAT TCT ATT AGG CTT AAA AAC CCT AAT TAT AAC 288 
Asp Tyr Ala His Ala Asn Ser lie Arg Leu Lys Asn Pro Asn Tyr Asn 
310 315 320 

AAC GAA GTG GTG CAA TTG GCG GGT CAA GTT CTT GGG AAA CAA GAA ATC 336 
Asn Glu Val Val Gin Leu Ala Gly Gin Val Leu Gly Lys Gin Glu lie 
325 330 335 340 

AAT CGT TTA ACG AGC CTT GCT GAT CCC AAA ACC TTT GAG CCA AAC ATG 3 84 

Asn Arg Leu Thr Ser Leu Ala Asp Pro Lys Thr Phe Glu Pro Asn Met 
345 350 355 

CTC ACT TAT GGG GGG GCT ATG GAT GTG ATG GTT AAT GTC ATT AAT AAT 432 
Leu Thr Tyr Gly Gly Ala Met Asp Val Met Val Asn Val lie Asn Asn 
360 365 370 

GGC ATC ATG AGT TTG GGG GCT TTT GGT GGG GTG CAA TTA GCC GGC AAT 480 
Gly lie Met Ser Leu Gly Ala Phe Gly Gly Val Gin Leu Ala Gly Asn 
375 380 385 

TCA TGG CTT ATG GCG ACG CCG AGC TTT GAG GGC ATT TTA GTG GAG CAA 528 
Ser Trp Leu Met Ala Thr Pro Ser Phe Glu Gly lie Leu Val Glu Gin 
390 395 400 

GCT TTG GTG AGC AAG AAA GCC ACT TCT TTC CAA TTT TTA TTC AAT GTG 576 
Ala Leu Val Ser Lys Lys Ala Thr Ser Phe Gin Phe Leu Phe Asn Val 
405 410 415 420 

GGG GCT CGC TTA AGG ATC TTA AAG CAT TCT AGC ATT GAA GCG GGC GTG 624 
Gly Ala Arg Leu Arg lie Leu Lys His Ser Ser lie Glu Ala Gly Val 
425 430 435 

AAG TTC CCC ATG TTA AAG AAA AAC CCC TAT ATC ACT GCA AAA AAC TTG 672 
Lys Phe Pro Met Leu Lys Lys Asn Pro Tyr lie Thr Ala Lys Asn Leu 
440 445 450 

GAT ATA GGG TTT AGG CGC GTG TAT TCA TGG TAT GTG AAT TAT GTG TTC 720 
Asp lie Gly Phe Arg Arg Val Tyr Ser Trp Tyr Val Asn Tyr Val Phe 
455 460 465 



ACT TTC TAG 
Thr Phe * 
470 



729 



(2) ANGABEN ZU SEQ ID NO: 94: 
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(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 243 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 94: 

Met Lys Lys lie Phe Ser Gin Ser Leu Leu Ala Leu Val Val Ser Val 
15 10 15 

Asn Ala Leu Leu Ala Met Asp Gly Asn Gly Val Phe lie Gly Ala Gly 
20 25 30 

Tyr Leu Gin Gly Gin Ala Gin Met His Ala Asp lie Asn Ser Gin Lys 
35 40 45 

Gin Ala Thr Ser Ala Thr He Lys Gly Phe Asp Ala Leu Leu Gly Tyr 
50 55 60 

Gin Phe Phe Phe Gly Lys Tyr Phe Gly Leu Arg Leu Tyr Gly Phe Phe 
65 70 75 80 

Asp Tyr Ala His Ala Asn Ser He Arg Leu Lys Asn Pro Asn Tyr Asn 
85 90 95 

Asn Glu Val Val Gin Leu Ala Gly Gin Val Leu Gly Lys Gin Glu He 
100 105 110 

Asn Arg Leu Thr Ser Leu Ala Asp Pro Lys Thr Phe Glu Pro Asn Met 
115 120 125 

Leu Thr Tyr Gly Gly Ala Met Asp Val Met Val Asn Val He Asn Asn 
130 135 140 

Gly He Met Ser Leu Gly Ala Phe Gly Gly Val Gin Leu Ala Gly Asn 
145 150 155 160 

Ser Trp Leu Met Ala Thr Pro Ser Phe Glu Gly He Leu Val Glu Gin 
165 170 175 

Ala Leu Val Ser Lys Lys Ala Thr Ser Phe Gin Phe Leu Phe Asn Val 
180 185 190 

Gly Ala Arg Leu Arg He Leu Lys His Ser Ser He Glu Ala Gly Val 
195 200 205 

Lys Phe Pro Met Leu Lys Lys Asn Pro Tyr He Thr Ala Lys Asn Leu 
210 215 220 

Asp He Gly Phe Arg Arg Val Tyr Ser Trp Tyr Val Asn Tyr Val Phe 
225 230 235 240 

Thr Phe * 

(2) ANGABEN ZU SEQ ID NO: 95: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 975 Basenpaare 

(B) ART: Nucleotid 

(C) STRANG FORM : beides 
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(D) TOPOLOGIE: linear 



(vii) UNMI TTELB ARE HERKUNFT: 
(B) CLON(E) : HPS099 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL : CDS 

(B) LAGE:1..975 

(xi) SEQUENZBESCHREIBUNG : SEQ ID NO: 95: 

ATG CCG GAA AAT TCT AAA CTA CAA CCT GCT AAG TTA GGG AAA AAT TTT 4 8 

Met Pro Glu Asn Ser Lys Leu Gin Pro Ala Lys Leu Gly Lys Asn Phe 
245 250 255 

GAC CCT GTG GAT CAT TCT AAC AGG AAT TTT TTC TTT TCT CTC ATT CTG 96 
Asp Pro Val Asp His Ser Asn Arg Asn Phe Phe Phe Ser Leu lie Leu 
260 265 270 275 

TCT GTA TTG TTA CAC TGG TTG ATT TAT TTT TTA TTT GAA CAC AGA GAA 144 
Ser Val Leu Leu His Trp Leu He Tyr Phe Leu Phe Glu His Arg Glu 
280 285 290 

GAT TTT TTT CCT TCA AAA CCC AAG CTT GTT AAA TTA AAT CCT GAA AAT 192 
Asp Phe Phe Pro Ser Lys Pro Lys Leu Val Lys Leu Asn Pro Glu Asn 
295 300 305 

TTA TTG GTT TTA AAA AGA GGC CAT TCG CAA GAT CCC AGT AAA AAC ACC 240 
Leu Leu Val Leu Lys Arg Gly His Ser Gin Asp Pro Ser Lys Asn Thr 
310 315 320 

CAG GGC GCT CCT AAA CCC ACG CTG GCT GGC CCC CAA AAA CCT CCA ACG 288 
Gin Gly Ala Pro Lys Pro Thr Leu Ala Gly Pro Gin Lys Pro Pro Thr 
325 330 335 

CCT CCC ACA CCC CCA ACT CCG CCA ACC CCG CCA ACC CCG CCA AAA CCT 336 
Pro Pro Thr Pro Pro Thr Pro Pro Thr Pro Pro Thr Pro Pro Lys Pro 
340 345 350 355 

ATA GAA AAG CCT AAG CCT GAG CCT AAA CCA AAA CCC AAA CCT GAA CCC 384 
He Glu Lys Pro Lys Pro Glu Pro Lys Pro Lys Pro Lys Pro Glu Pro 
360 365 370 

AAA AAG CCC AAT CAT AAA CAC AAG GCT CTT AAA AAA GTG GAA AAA GTG 432 
Lys Lys Pro Asn His Lys His Lys Ala Leu Lys Lys Val Glu Lys Val 
375 380 385 

GAA GAG AAA AAA GTA GTA GAG GAG AAA AAA GAA GAG AAA AAA ATC GTA 480 
Glu Glu Lys Lys Val Val Glu Glu Lys Lys Glu Glu Lys Lys He Val 
390 395 400 

GAG CAG AAA GTA GAA CAA AAA GTA GAG CAG AAA AAA ATA GAA GAG AAA 528 
Glu Gin Lys Val Glu Gin Lys Val Glu Gin Lys Lys He Glu Glu Lys 
405 410 415 

AAA CCT GTC AAA AAA GAA TTT GAC CCT AAC CAG CTT TCT TTC TTG CCT 576 
Lys Pro Val Lys Lys Glu Phe Asp Pro Asn Gin Leu Ser Phe Leu Pro 
420 425 430 435 
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AAA GAA GTT GCG CCA CCC AGA CAA GAA AAT AAT AAA GGC TTG GAT AAC 624 
Lys Glu Val Ala Pro Pro Arg Gin Glu Asn Asn Lys Gly Leu Asp Asn 
440 445 450 

CAA ACC AGA AGG GAT ATT GAT GAA TTG TAT GGC GAA GAA TTT GGG GAT 672 
Gin Thr Arg Arg Asp lie Asp Glu Leu Tyr Gly Glu Glu Phe Gly Asp 
455 460 465 

TTA GGC ACA GCC GAA AAA GAT TTC ATC AGG AAT AAT TTA AGG GAT ATT 720 
Leu Gly Thr Ala Glu Lys Asp Phe lie Arg Asn Asn Leu Arg Asp lie 
470 475 480 

GGG CGC ATC ACG CAA AAA TAT TTA GAA TAC CCT CAA GTA GCG GCT TAT 768 
Gly Arg lie Thr Gin Lys Tyr. Leu Glu Tyr Pro Gin Val Ala Ala Tyr 
485 490 495 

TTA GGG CAG GAC GGG ACG AAT GCG GTA GAG TTT TAC TTG CAC CCT AAT 816 
Leu Gly Gin Asp Gly Thr Asn Ala Val Glu Phe Tyr Leu His Pro Asn 
500 505 510 515 

GGC GAT ATT ACC GAT CTT AAA ATC ATC ATT GGC TCT GAA TAC AAA ATG 864 
Gly Asp lie Thr Asp Leu Lys lie lie lie Gly Ser Glu Tyr Lys Met 
520 525 530 

CTT GAT GAC AAC ACC TTA AAG ACC ATT CAG ATC GCT TAT AAG GAT TAC 912 
Leu Asp Asp Asn Thr Leu Lys Thr lie Gin lie Ala Tyr Lys Asp Tyr 
535 540 , 545 

CCA CGC CCC AAA ACT AAA ACC CTC ATT CGC ATC AGA GTG CGT TAT TAC 960 
Pro Arg Pro Lys Thr Lys Thr Leu lie Arg He Arg Val Arg Tyr Tyr 
550 555 560 

TTA GGG GGC AAT TAA 975 
Leu Gly Gly Asn * 
565 



(2) ANGABEN ZU SEQ ID NO: 96: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 325 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 96: 

Met Pro Glu Asn Ser Lys Leu Gin Pro Ala Lys Leu Gly Lys Asn Phe 
15 10 15 

Asp Pro Val Asp His Ser Asn Arg Asn Phe Phe Phe Ser Leu He Leu 
20 25 30 

Ser Val Leu Leu His Trp Leu He Tyr Phe Leu Phe Glu His Arg Glu 
35 40 45 

Asp Phe Phe Pro Ser Lys Pro Lys Leu Val Lys Leu Asn Pro Glu Asn 
50 55 60 

Leu Leu Val Leu Lys Arg Gly His Ser Gin Asp Pro Ser Lys Asn Thr 
65 70 75 80 
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Gin Gly Ala Pro Lys Pro Thr Leu Ala Gly Pro Gin Lys Pro Pro Thr 

85 90 95 

Pro Pro Thr Pro Pro Thr Pro Pro Thr Pro Pro Thr Pro Pro Lys Pro 
100 105 110 

lie Glu Lys Pro Lys Pro Glu Pro Lys Pro Lys Pro Lys Pro Glu Pro 
115 120 125 

Lys Lys Pro Asn His Lys His Lys Ala Leu Lys Lys Val Glu Lys Val 
130 135 140 

Glu Glu Lys Lys Val Val Glu Glu Lys Lys Glu Glu Lys Lys lie Val 
145 150 155 160 

Glu Gin Lys Val Glu Gin Lys Val Glu Gin Lys Lys lie Glu Glu Lys 
165 170 175 

Lys Pro Val Lys Lys Glu Phe Asp Pro Asn Gin Leu Ser Phe Leu Pro 
180 185 190 

Lys Glu Val Ala Pro Pro Arg Gin Glu Asn Asn Lys Gly Leu Asp Asn 
195 200 205 

Gin Thr Arg Arg Asp lie Asp Glu Leu Tyr Gly Glu Glu Phe Gly Asp 
210 215 220 

Leu Gly Thr Ala Glu Lys Asp Phe He Arg Asn Asn Leu Arg Asp He 
225 230 235 240 

Gly Arg He Thr Gin Lys Tyr Leu Glu Tyr Pro Gin Val Ala Ala Tyr 
245 250 255 

Leu Gly Gin Asp Gly Thr Asn Ala Val Glu Phe Tyr Leu His Pro Asn 
260 265 270 

Gly Asp He Thr Asp Leu Lys He He He Gly Ser Glu Tyr Lys Met 
275 280 285 

Leu Asp Asp Asn Thr Leu Lys Thr He Gin He Ala Tyr Lys Asp Tyr 
290 295 300 

Pro Arg Pro Lys Thr Lys Thr Leu He Arg He Arg Val Arg Tyr Tyr 
305 310 315 320 

Leu Gly Gly Asn * 
325 

(2) ANGABEN ZU SEQ ID NO: 97: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 1290 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT: 

(B) CLON(E) : HPS117 (HPS118, HPS162) 



(ix) MERKMAL: 
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(A) NAME/ SCHLUSSEL : CDS 

(B) LAGE : 1 . .1290 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 97: 

ATG CCA TAC GCC TTA AGA AAA AGA TTT TTC AAA CGC TTT GCG CTG ATT 48 
Met Pro Tyr Ala Leu Arg Lys Arg Phe Phe Lys Arg Phe Ala Leu lie 
330 335 340 

GTT TCA ACT TTT TGT GCG ATA AGC TTG AAC GCT AAA AGC TAT CTG TTT 96 
Val Ser Thr Phe Cys Ala He Ser Leu Asn Ala Lys Ser Tyr Leu Phe 
345 350 355 

TCC CCT TTG CCC CCA GCA CAC CAG CAA ATC ATT AAG ACA GAG CCT TGC 144 
Ser Pro Leu Pro Pro Ala His Gin Gin He He Lys Thr Glu Pro Cys 
360 365 370 

TCT TTG GAA TGC TTG AAA GAC TTG ATG CTG CAA AAT CAA ATC TTT TCT 192 
Ser Leu Glu Cys Leu Lys Asp Leu Met Leu Gin Asn Gin He Phe Ser 
375 380 385 

TTT GTG TCT CAA TAC GAT AAC AAC AAC CAA GAT GAG AGC CTT AAA ACT 240 
Phe Val Ser Gin Tyr Asp Asn Asn Asn Gin Asp Glu Ser Leu Lys Thr 
390 395 400 405 

TAT TAT CAT GAC ATA CTC AAT AAA CTC AAC CCC GTA TTC ATC GCT TCT 2 88 

Tyr Tyr His Asp He Leu Asn Lys Leu Asn Pro Val Phe He Ala Ser 
410 415 420 

CAA ACT CCA GCT AAA GAA AGC TAT GAG CCT AAG ATT GAA TTA GCG GTT 336 
Gin Thr Pro Ala Lys Glu Ser Tyr Glu Pro Lys He Glu Leu Ala Val 
425 430 435 

TTA CTG CCT AAA AAG GTG GTG GGG CGT TAT GCG ATT TCG GTG ATG AAC 384 
Leu Leu Pro Lys Lys Val Val Gly Arg Tyr Ala He Ser Val Met Asn 
440 445 450 

ACC CTT TTA GCG TAT TTG AAC ACC AGA AAC AAC GAT TTC AAT ATC CAA 432 
Thr Leu Leu Ala Tyr Leu Asn Thr Arg Asn Asn Asp Phe Asn He Gin 
455 460 465 

GTC TTT GAC AGC GAT GAA GAA AGC CCT GAA AAA TTA GAG CAA ACC TAT 480 
Val Phe Asp Ser Asp Glu Glu Ser Pro Glu Lys Leu Glu Gin Thr Tyr 
470 475 480 485 

AAA GAA ATT GAA AAA GAA AAA TTC CCT TTT GTG ATA GCC TTA TTG ACT 528 
Lys Glu He Glu Lys Glu Lys Phe Pro Phe Val He Ala Leu Leu Thr 
490 495 500 

AAA GAG GGC GTG GAA AAT TTG CTC CAA AAC ACC ACC ATT AGC ACC CCT 576 
Lys Glu Gly Val Glu Asn Leu Leu Gin Asn Thr Thr He Ser Thr Pro 
505 510 515 

ACT TAT GTG CCT ACG GTG AAT AGA GCG CAA TTG GAA AAT CAA ACT GAA 624 
Thr Tyr Val Pro Thr Val Asn Arg Ala Gin Leu Glu Asn Gin Thr Glu 
520 525 530 

CGT TCT TTG AGC GAG CGC TTG TAT TTT GGG GGG ATT GAT TAT AAA GAG 672 
Arg Ser Leu Ser Glu Arg Leu Tyr Phe Gly Gly He Asp Tyr Lys Glu 
535 540 545 
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CAA TTA AGC ATG CTC ACG GCT TTC ATT AAC CCT AAT TCG CCC GTG ATT 720 
Gin Leu Ser Met Leu Thr Ala Phe lie Asn Pro Asn Ser Pro Val lie 
550 555 560 565 

GAA TAG GAT GAC GAT GGC CTA ATA GGT GAA CGC TTG AGG CAA ATC ACG 768 

Glu Tyr Asp Asp Asp Gly Leu lie Gly Glu Arg Leu Arg Gin lie Thr 

570 575 580 

« 

GAG TCT TTA AGC ATT GAA GTC AAA CAC CAA GAA AAT ATT TCT TAC AAG 816 

Glu Ser Leu Ser lie Glu Val Lys His Gin Glu Asn He Ser Tyr Lys 
585 590 595 

CAA GCC ACG AGT TTT TCT AAA AAT TTT AGA AAA AAC GAT GCG TTT TTT 864 
Gin Ala Thr Ser Phe Ser Lys Asn Phe Arg Lys Asn Asp Ala Phe Phe 
600 605 610 

AAA AAT TCT ATT TTG ATT TTA AAC ACC CCT ACC ACT AAA AGC GGC CTT 912 
Lys Asn Ser He Leu He Leu Asn Thr Pro Thr Thr Lys Ser Gly Leu 
615 620 625 

ATT CTT TCT CAA ATA GGG CTT TTA GAA TAC AAG CCT CTT AAA ATC CTT 960 
He Leu Ser Gin He Gly Leu Leu Glu Tyr Lys Pro Leu Lys He Leu 
630 635 640 645 

TCC ACA CAA ATC AAT TTC AAC CCC TCT CTA CTC TTA CTC ACC CAA CCT 1008 
Ser Thr Gin He Asn Phe Asn Pro Ser Leu Leu Leu Leu Thr Gin Pro 
650 655 660 

AAA GAC AGA AAG GAT TTA TTC ATT GTC AAT GCC TTG CAA AAT AGC GAT 1056 
Lys Asp Arg Lys Asp Leu Phe He Val Asn Ala Leu Gin Asn Ser Asp 
665 670 675 

GAA ACG CTT ATA GAA TAC GCC TCC TTA TTG GAG AGC GAT TTA AGG CAT 1104 
Glu Thr Leu He Glu Tyr Ala Ser Leu Leu Glu Ser Asp Leu Arg His 
680 685 690 

GAT TGG GTG AAT TAT TCC AGC GCA ATC GGG CTA GAG GTG TTT TTA AAC 1152 
Asp Trp Val Asn Tyr Ser Ser Ala He Gly Leu Glu Val Phe Leu Asn 
695 700 705 

ACG CTA GAT CCG CAT TTT AAA AAA TCT TTT CAA GAG AAT TTA GAA GAC 1200 
Thr Leu Asp Pro His Phe Lys Lys Ser Phe Gin Glu Asn Leu Glu Asp 
710 715 720 725 

AAT CAG GTC CGT TAC CAC AAT CAA ATT TAT CAG GCT TTA GGG TAT TCT 1248 
Asn Gin Val Arg Tyr His Asn Gin He Tyr Gin Ala Leu Gly Tyr Ser 
730 735 740 

TTT GAG CCA ATA AAA AAT GAA AGC GGA ACA AAA AAA GAA TAA 1290 
Phe Glu Pro He Lys Asn Glu Ser Gly Thr Lys Lys Glu * 
745 750 755 



(2) ANGABEN ZU SEQ ID NO: 98: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 430 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 98: 
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Met Pro Tyr Ala Leu Arg Lys Arg Phe Phe Lya Arg Phe Ala Leu lie 
1 5 10 15 

Val Ser Thr Phe Cys Ala lie Ser Leu Asn Ala Lys Ser Tyr Leu Phe 
20 25 30 

Ser Pro Leu Pro Pro Ala His Gin Gin lie lie Lys Thr Glu Pro Cys 
35 40 45 

Ser Leu Glu Cys Leu Lys Asp Leu Met Leu Gin Asn Gin lie Phe Ser 
50 55 60 

Phe Val Ser Gin Tyr Asp Asn Asn Asn Gin Asp Glu Ser Leu Lys Thr 
65 70 75 80 

Tyr Tyr His Asp lie Leu Asn Lys Leu Asn Pro Val Phe lie Ala Ser 
85 90 95 

Gin Thr Pro Ala Lys Glu Ser Tyr Glu Pro Lys lie Glu Leu Ala Val 
100 105 110 

Leu Leu Pro Lys Lys Val Val Gly Arg Tyr Ala lie Ser Val Met Asn 
115 120 125 

Thr Leu Leu Ala Tyr Leu Asn Thr Arg Asn Asn Asp Phe Asn He Gin 
130 135 140 

Val Phe Asp Ser Asp Glu Glu Ser Pro Glu Lys Leu Glu Gin Thr Tyr 
145 150 155 160 

Lys Glu lie Glu Lys Glu Lys Phe Pro Phe Val He Ala Leu Leu Thr 
165 170 175 

Lys Glu Gly Val Glu Asn Leu Leu Gin Asn Thr Thr He Ser Thr Pro 
180 185 190 

Thr Tyr Val Pro Thr Val Asn Arg Ala Gin Leu Glu Asn Gin Thr Glu 
195 200 205 

Arg Ser Leu Ser Glu Arg Leu Tyr Phe Gly Gly He Asp Tyr Lys Glu 
210 215 220 

Gin Leu Ser Met Leu Thr Ala Phe He Asn Pro Asn Ser Pro Val He 
225 230 235 240 

Glu Tyr Asp Asp Asp Gly Leu He Gly Glu Arg Leu Arg Gin He Thr 
245 250 255 

Glu Ser Leu Ser He Glu Val Lys His Gin Glu Asn He Ser Tyr Lys 
260 265 270 

Gin Ala Thr Ser Phe Ser Lys Asn Phe Arg Lys Asn Asp Ala Phe Phe 
275 ' 280 285 

Lys Asn Ser He Leu He Leu Asn Thr Pro Thr Thr Lys Ser Gly Leu 
290 295 300 

He Leu Ser Gin He Gly Leu Leu Glu Tyr Lys Pro Leu Lys He Leu 
305 310 315 320 

Ser Thr Gin He Asn Phe Asn Pro Ser Leu Leu Leu Leu Thr Gin Pro 
325 330 335 
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Lys Asp Arg Lys Asp Leu Phe lie Val Asn Ala Leu Gin Asn Ser Asp 
340 345 350 

Glu Thr Leu lie Glu Tyr Ala Ser Leu Leu Glu Ser Asp Leu Arg His 
355 360 365 

Asp Trp Val Asn Tyr Ser Ser Ala lie Gly Leu Glu Val Phe Leu Asn 
370 375 380 

Thr Leu Asp Pro His Phe Lys Lys Ser Phe Gin Glu Asn Leu Glu Asp 
385 390 395 400 

Asn Gin Val Arg Tyr His Asn Gin lie Tyr Gin Ala Leu Gly Tyr Ser 
405 410 415 

Phe Glu Pro lie Lys Asn Glu Ser Gly Thr Lys Lys Glu * 
420 425 430 

(2) ANGABEN ZU SEQ ID NO: 99: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 1644 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNM I TTE LB ARE HERKUNFT: 

(B) CLON(E) : HPS004 (HPS027, HPS121, HPS131) 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE : 1 . . 1644 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 99: 

ATG GAT AAA AAC AAC AAT AAT CTC CGC TTG ATT TTA GCG ATC GCT CTG 48 
Met Asp Lys Asn Asn Asn Asn Leu Arg Leu lie Leu Ala lie Ala Leu 
435 440 445 

TCT TTC TTG TTT ATC GCT CTT TAT AGC TAT TTT TTC CAA AAA CCA AAC 96 
Ser Phe Leu Phe lie Ala Leu Tyr Ser Tyr Phe Phe Gin Lys Pro Asn 
450 455 460 

AAA ACA ACA ACC CAA ACC ACA AAG CAA GAA ACA ACC AAC AAC CAT ACA 144 
Lys Thr Thr Thr Gin Thr Thr Lys Gin Glu Thr Thr Asn Asn His Thr 
465 470 475 

GCA ACA AGT CCT AAC GCG CCC AAC GCC CAA CAT TTT AGC ACC ACT CAA 192 
Ala Thr Ser Pro Asn Ala Pro Asn Ala Gin His Phe Ser Thr Thr Gin 
480 485 490 

ACA ACC CCC CAA GAG AAT TTG CTA AGC ACG ATT TCT TTT GAG CAT GCC 240 
Thr Thr Pro Gin Glu Asn Leu Leu Ser Thr lie Ser Phe Glu His Ala 
495 500 505 510 

AGG ATT GAA ATT GAT TCT TTA GGG CGC ATC AAA CAG GTT TAT CTC AAG 288 
Arg lie Glu lie Asp Ser Leu Gly Arg lie Lys Gin Val Tyr Leu Lys 
515 520 525 
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GAT AAA AAG TAT CTA ACC CCT AAA CAA AAG GGC TTT TTA GAG CAT GTG 336 
Asp Lys Lys Tyr Leu Thr Pro Lys Gin Lys Gly Phe Leu Glu His Val 
530 535 540 

GGC CAT CTT TTT AGC TCC AAA GAA AAC GCG CAA CCC CCC CTA AAA GAG 384 
Gly His Leu Phe Ser Ser Lys Glu Asn Ala Gin Pro Pro Leu Lys Glu 
545 550 555 

CTC CCC CTT TTA GCA GCC GAT AAA CTC AAG CCT TTA GAA GTG CGT TTT 432 
Leu Pro Leu Leu Ala Ala Asp Lys Leu Lys Pro Leu Glu Val Arg Phe 
560 565 570 

TTA GAC CCT ACG CTC AAT AAC AAA GCG TTC AAC ACC CCT TAT AGC GCT 480 
Leu Asp Pro Thr Leu Asn Asn Lys Ala Phe Asn Thr Pro Tyr Ser Ala 
575 580 585 590 

TCA AAA ACC ACT CTT GGG CCT AAC GAA CAG CTT GTT TTA ACC CAA GAT 528 
Ser Lys Thr Thr Leu Gly Pro Asn Glu Gin Leu Val Leu Thr Gin Asp 
595 600 605 

TTA GGC ACT CTT AGC ATC ATT AAA ACC CTG ACT TTC TAT GAT GAT TTG 576 
Leu Gly Thr Leu Ser lie lie Lys Thr Leu Thr Phe Tyr Asp Asp Leu 
610 615 620 

CAT TAT GAT TTA AAA ATC GCA TTC AAA TCG CCC AAT AAC CTT ATC CCT 624 
His Tyr Asp Leu Lys lie Ala Phe Lys Ser Pro Asn Asn Leu lie Pro 
625 630 635 

AGC TAT GTG ATC ACC AAT GGT TAC AGG CCG GTG GCT GAT TTG GAC AGC 672 
Ser Tyr Val He Thr Asn Gly Tyr Arg Pro Val Ala Asp Leu Asp Ser 
640 645 650 

TAC ACC TTT TCA GGC GTG CTT TTA GAA AAT AGC GAC AAA AAA ATT GAA 720 
Tyr Thr Phe Ser Gly Val Leu Leu Glu Asn Ser Asp Lys Lys He Glu 
655 660 665 670 

AAA ATT GAA GAT AAA GAC GCT AAA GAA ATC AAA CGC TTT TCT AAC ACC 768 
Lys He Glu Asp Lys Asp Ala Lys Glu He Lys Arg Phe Ser Asn Thr 
675 680 685 

CTC TTT TTA TCC AGC GTG GAT AGG TAT TTC ACC ACC TTG CTT TTC ACT 816 
Leu Phe Leu Ser Ser Val Asp Arg Tyr Phe Thr Thr Leu Leu Phe Thr 
690 695 700 

AAA GAT CCT CAA GGT TTT GAA GCC TTA ATT GAT TCA GAA ATC GGC ACT 864 
Lys Asp Pro Gin Gly Phe Glu Ala Leu He Asp Ser Glu He Gly Thr 
705 710 715 

AAA AAC CCC TTA GGG TTC ATT TCC CTT AAA AAT GAA GCG AAT TTG CAT 912 
Lys Asn Pro Leu Gly Phe He Ser Leu Lys Asn Glu Ala Asn Leu His 
720 725 730 

GGC TAT ATT GGC CCT AAG GAT TAC CGC TCT TTG AAA GCG ATT TCA CCC 960 
Gly Tyr He Gly Pro Lys Asp Tyr Arg Ser Leu Lys Ala He Ser Pro 
735 740 745 750 

ATG CTC ACC GAT GTG ATA GAG TAT GGC TTA ATC ACT TTC TTT GCA AAA 1008 
Met Leu Thr Asp Val He Glu Tyr Gly Leu He Thr Phe Phe Ala Lys 
755 760 765 

GGC GTG TTT GTT TTA CTG GAT TAT TTG TAT CAA TTC GTG GGC AAT TGG 1056 
Gly Val Phe Val Leu Leu Asp Tyr Leu Tyr Gin Phe Val Gly Asn Trp 
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770 775 780 

GGT TGG GCT ATC ATT CTT TTA ACG ATT ATC GTG CGC ATC ATC CTT TAT 1104 
Gly Trp Ala lie lie Leu Leu Thr lie lie Val Arg lie lie Leu Tyr 
785 790 795 

CCT TTA AGC TAT AAG GGC ATG GTG AGC ATG CAA AAG CTC AAA GAA TTA 1152 
Pro Leu Ser Tyr Lys Gly Met Val Ser Met Gin Lys Leu Lys Glu Leu 
800 805 810 

GCC CCT AAA ATG AAA GAA CTC CAA GAA AAA TAC AAG GGC GAA CCC CAA 1200 
Ala Pro Lys Met Lys Glu Leu Gin Glu Lys Tyr Lys Gly Glu Pro Gin 
815 820 825 830 

AAA TTG CAA GCC CAC ATG ATG CAG CTT TAC AAA AAA CAT GGG GCT AAC 124 8 

Lys Leu Gin Ala His Met Met Gin Leu Tyr Lys Lys His Gly Ala Asn 
835 840 845 

CCA CTA GGG GGT TGT CTG CCC TTA ATC TTA CAA ATC CCG GTG TTT TTT 1296 
Pro Leu Gly Gly Cys Leu Pro Leu lie Leu Gin lie Pro Val Phe Phe 
850 855 860 

GCC ATT TAT AGA GTG CTT TAT AAC GCT GTG GAA TTG AAA AGC TCA GAG 1344 
Ala lie Tyr Arg Val Leu Tyr Asn Ala Val Glu Leu Lys Ser Ser Glu 
865 870 875 

TGG ATC TTA TGG ATT CAT GAT TTA TCC ATC ATG GAT CCG TAT TTT ATT 1392 
Trp lie Leu Trp lie His Asp Leu Ser lie Met Asp Pro Tyr Phe lie 
880 885 890 

TTA CCG CTT CTT ATG GGA GCG TCT ATG TAT TGG CAC CAA AGC GTT ACG 1440 
Leu Pro Leu Leu Met Gly Ala Ser Met Tyr Trp His Gin Ser Val Thr 
895 900 905 910 

CCA AAC ACC ATG ACC GAT CCC ATG CAA GCA AAG ATT TTT AAA CTC TTA 1488 
Pro Asn Thr Met Thr Asp Pro Met Gin Ala Lys lie Phe Lys Leu Leu 
915 920 925 

CCC CTA TTA TTC ACA ATC TTT TTA ATC ACT TTC CCG GCA GGG TTA GTC 1536 
Pro Leu Leu Phe Thr lie Phe Leu He Thr Phe Pro Ala Gly Leu Val 
930 935 940 

TTG TAT TGG ACC ACG AAC AAC ATC CTT TCG GTG TTG CAA CAA CTC ATC 1584 
Leu Tyr Trp Thr Thr Asn Asn He Leu Ser Val Leu Gin Gin Leu He 
945 950 955 

ATC AAT AAA GTC TTA GAG AAT AAA AAA CGC ATG CAT GCG CAA AAC AAA 1632 
He Asn Lys Val Leu Glu 'Asn Lys Lys Arg Met His Ala Gin Asn Lys 
960 965 970 

AAG GAA CAT TGA 1644 

Lys Glu His * 

975 



(2) ANGABEN ZU SEQ ID NO: 100: 

(i) SEQUENZKENNZEICHEN : 

(A) LANGE: 548 Aminosauren 

(B) ART: Amino saure 
<D) TOPOLOGIE: linear 
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<ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 100: 

Met Asp Lys Asn Asn Asn Asn Leu Arg Leu lie Leu Ala He Ala Leu 
1 5 10 15 

Ser Phe Leu Phe He Ala Leu Tyr Ser Tyr Phe Phe Gin Lys Pro Asn 
20 25 30 

Lvs Thr Thr Thr Gin Thr Thr Lys Gin Glu Thr Thr Asn Asn His Thr 
J 35 40 45 

Ala Thr Ser Pro Asn Ala Pro Asn Ala Gin His Phe Ser Thr Thr Gin 
50 55 60 

Thr Thr Pro Gin Glu Asn Leu Leu Ser Thr He Ser Phe Glu His Ala 
65 70 75 80 

Ara He Glu He Asp Ser Leu Gly Arg He Lys Gin Val Tyr Leu Lys 
3 90 95 



85 



Asp Lvs Lys Tyr Leu Thr Pro Lys Gin Lys Gly Phe Leu Glu His Val 
100 105 HO 

Glv His Leu Phe Ser Ser Lys Glu Asn Ala Gin Pro Pro Leu Lys Glu 
115 120 125 

Leu Pro Leu Leu Ala Ala Asp Lys Leu Lys Pro Leu Glu Val Arg Phe 
130 135 140 

Leu Asp Pro Thr Leu Asn Asn Lys Ala Phe Asn Thr Pro Tyr Ser Ala 
145 150 155 160 

Ser Lys Thr Thr Leu Gly Pro Asn Glu Gin Leu Val Leu Thr Gin Asp 
165 170 175 

Leu Glv Thr Leu Ser He He Lys Thr Leu Thr Phe Tyr Asp Asp Leu 
180 185 190 

His Tyr Asp Leu Lys He Ala Phe Lys Ser Pro Asn Asn Leu He Pro 
195 200 205 

Ser Tyr Val He Thr Asn Gly Tyr Arg Pro Val Ala Asp Leu Asp Ser 
210 215 220 

Tyr Thr Phe Ser Gly Val Leu Leu Glu Asn Ser Asp Lys Lys He Glu 
225 230 235 240 

Lys He Glu Asp Lys Asp Ala Lys Glu He Lys Arg Phe Ser Asn Thr 
245 250 255 

Leu Phe Leu Ser Ser Val Asp Arg Tyr Phe Thr Thr Leu Leu Phe Thr 
260 265 270 

Lvs Asp Pro Gin Gly Phe Glu Ala Leu He Asp Ser Glu He Gly Thr 
* 275 280 285 

Lys Asn Pro Leu Gly Phe He Ser Leu Lys Asn Glu Ala Asn Leu His 
290 295 300 

Gly Tyr He Gly Pro Lys Asp Tyr Arg Ser Leu Lys Ala He Ser Pro 
305 310 315 320 
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Met Leu Thr Asp Val He Glu Tyr Gly Leu He Thr Phe Phe Ala Lys 
325 330 335 

Gly Val Phe Val Leu Leu Asp Tyr Leu Tyr Gin Phe Val Gly Asn Trp 
340 345 350 

Gly Trp Ala He He Leu Leu Thr He He Val Arg He He Leu Tyr 
355 360 365 

Pro Leu Ser Tyr Lys Gly Met Val Ser Met Gin Lys Leu Lys Glu Leu 
370 375 380 

Ala Pro Lys Met Lys Glu Leu Gin Glu Lys Tyr Lys Gly Glu Pro Gin 
385 390 395 400 

Lys Leu Gin Ala His Met Met Gin Leu Tyr Lys Lys His Gly Ala Asn 
405 410 415 

Pro Leu Gly Gly Cys Leu Pro Leu He Leu Gin He Pro Val Phe Phe 
420 425 430 

Ala He Tyr Arg Val Leu Tyr Asn Ala Val Glu Leu Lys Ser Ser Glu 
435 440 445 

Trp He Leu Trp He His Asp Leu Ser He Met Asp Pro Tyr Phe He 
450 455 460 

Leu Pro Leu Leu Met Gly Ala Ser Met Tyr Trp His Gin Ser Val Thr 
465 470 475 480 

Pro Asn Thr Met Thr Asp Pro Met Gin Ala Lys He Phe Lys Leu Leu 
485 490 495 

Pro Leu Leu Phe Thr He Phe Leu He Thr Phe Pro Ala Gly Leu Val 
500 505 510 

Leu Tyr Trp Thr Thr Asn Asn He Leu Ser Val Leu Gin Gin Leu He 
515 520 525 

He Asn Lys Val Leu Glu Asn Lys Lys Arg Met His Ala Gin Asn Lys 
530 535 540 

Lys Glu His * 
545 

(2) ANGABEN ZU SEQ ID NO: 101: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 3 063 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT: 
(B) CLON(E) : HPS132 



(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE : 1 . .3063 
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(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 101: 

ATG ATG CTC GCT TCC ATT ATT GAA TTT TCC TTA CGC CAA AGA GTG ATC 48 
Met Met Leu Ala Ser lie lie Glu Phe Ser Leu Arg Gin Arg Val He 
550 555 560 

GTG ATT GTT GGT GCG ATT CTT ATT TTA TTT TTT GGG ACT TAT AGT TTT 96 
Val He Val Gly Ala He Leu He Leu Phe Phe Gly Thr Tyr Ser Phe 
565 570 575 580 

ATC AAC ACT CCA GTG GAC GCT TTC CCG GAT ATT TCG CCC ACT CAA GTT 144 
He Asn Thr Pro Val Asp Ala Phe Pro Asp He Ser Pro Thr Gin Val 
585 590 595 

AAA ATC ATT TTA AAA CTC CCC GGC TCT AGC CCT GAA GAA ATG GAA AAC 192 
Lys He He Leu Lys Leu Pro Gly Ser Ser Pro Glu Glu Met Glu Asn 
600 605 610 

AAC ATC GTG CGC CCT TTA GAA TTG GAG CTT TTA GGC TTG AAA GGG CAA 240 
Asn He Val Arg Pro Leu Glu Leu Glu Leu Leu Gly Leu Lys Gly Gin 
615 620 625 

AAA TCT TTA AGG AGT GTT TCA AAA TAT TCT ATT TCA GAT ATT ACG ATA 288 
Lys Ser Leu Arg Ser Val Ser Lys Tyr Ser He Ser Asp He Thr He 
630 635 640 

GAT TTT GAT GAC AGC GTG GAT ATT TAT TTA GCG AGG AAT ATT GTC AAT 336 
Asp Phe Asp Asp Ser Val Asp He Tyr Leu Ala Arg Asn He Val Asn 
645 650 655 660 

GAG CGC TTG AGC AGC GTG ATG AAA GAT TTA CCC GTG GGG GTT GAG GGG 384 
Glu Arg Leu Ser Ser Val Met Lys Asp Leu Pro Val Gly Val Glu Gly 
665 670 675 

GGC ATG GCG CCC ATT GTT ACG CCG CTA TCA GAT ATC TTT ATG TTC ACT 432 
Gly Met Ala Pro He Val Thr Pro Leu Ser Asp He Phe Met Phe Thr 
680 685 690 

ATT GAT GGC AAT ATC ACT GAG ATA GAA AAA CGA CAG CTT TTA GAT TTT 480 
He Asp Gly Asn He Thr Glu He Glu Lys Arg Gin Leu Leu Asp Phe 
695 700 705 

GTG ATC CGC CCA CAA TTA AGA ATG ATT AGC GGC GTA GCA GAT GTC AAT 528 
Val He Arg Pro Gin Leu Arg Met He Ser Gly Val Ala Asp Val Asn 
710 715 720 

TCC ATT GGA GGC TTT AGC AGA GCG TTT GTG ATC GTG CCG GAT TTT AAT 576 
Ser He Gly Gly Phe Ser Arg Ala Phe Val He Val Pro Asp Phe Asn 
725 730 735 740 

GAC ATG GCA AGG CTT GGG GTG AGT ATT TCT GAT TTA GAA TCG GCT GTG 624 
Asp Met Ala Arg Leu Glv Val Ser He Ser Asp Leu Glu Ser Ala Val 
745 " 750 755 

AGA GTG AAT TTA AGA AAC AGC GGA GCG GGG CGC GTG GAT AGA GAT GGC 672 
Arg Val Asn Leu Arg Asn Ser Gly Ala Gly Arg Val Asp Arg Asp Gly 
760 765 770 

GAA ACC TTT TTA GTC AAA ATC CAA ACC GCT TCT TTG AGT TTA GAA GAC 720 
Glu Thr Phe Leu Val Lys He Gin Thr Ala Ser Leu Ser Leu Glu Asp 
775 780 785 
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ATT GGC AAA ATC ACC GTT TCC ACT AAT TTA GGG CAT TTG CAC ATT AAG 768 
lie Gly Lys lie Thr Val Ser Thr Asn Leu Gly His Leu His lie Lys 
790 795 800 

GAT TTT GCG AAA GTC ATC AGC CAG TCT CGC ACC CGT TTG GGG TTT GTT 816 
Asp Phe Ala Lys Val lie Ser Gin Ser Arg Thr Arg Leu Gly Phe Val 
805 810 815 820 

ACT AAA GAT GGC GTG GGC GAG ACC ACA GAA GGC TTG GTG CTT TCT TTA 864 
Thr Lys Asp Gly Val Gly Glu Thr Thr Glu Gly Leu Val Leu Ser Leu 
825 830 835 

AAA GAC GCT AAC ACC AAA GAA ATC ATC ACT CAA GTG TAT CAA AAA CTA 912 
Lys Asp Ala Asn Thr Lys Glu lie lie Thr Gin Val Tyr Gin Lys Leu 
840 845 850 

GAA GAA TTA AAA CCC TTT TTA CCG AAT GGC GTG TCC ATT AAT GTT TTT 960 
Glu Glu Leu Lys Pro Phe Leu Pro Asn Gly Val Ser lie Asn Val Phe 
855 860 865 

TAT GAT CGC TCA GAA TTT ACG CAA AAA GCC ATT GCC ACC GTT TCT AAA 1008 
Tyr Asp Arg Ser Glu Phe Thr Gin Lys Ala lie Ala Thr Val Ser Lys 
870 875 880 

ACC CTC ATT GAA GCC GTT GTT TTA ATC ATC ATC ACG CTC TTT TTA TTT 1056 
Thr Leu lie Glu Ala Val Val Leu He He He Thr Leu Phe Leu Phe 
885 890 895 900 

TTA GGG AAT TTG AGG GCG AGC GTG GCT GTG GGG GTG ATT TTA CCT TTA 1104 
Leu Gly Asn Leu Arg Ala Ser Val Ala Val Gly Val He Leu Pro Leu 
905 910 915 

AGC TTG TCC GTG GCG TTT ATT TTT ATC AAG TTT AGC GAT CTG ACT TTA 1152 
Ser Leu Ser Val Ala Phe He Phe He Lys Phe Ser Asp Leu Thr Leu 
920 925 930 

AAT TTG ATG AGT TTA GGG GGA TTG GTT ATC GCT ATA GGC ATG CTC ATT 1200 
Asn Leu Met Ser Leu Gly Gly Leu Val He Ala He Gly Met Leu He 
935 940 945 

GAC TCA GCC GTG GTG GTG GTG GAA AAC GCT TTT GAA AAA TTA AGC GCT 1248 
Asp Ser Ala Val Val Val Val Glu Asn Ala Phe Glu Lys Leu Ser Ala 
950 955 960 

AAC ACT AAA ACC ACT AAA CTC CAT GCA ATC TAT CGT TCG TGT AAA GAA 1296 
Asn Thr Lys Thr Thr Lys Leu His Ala He Tyr Arg Ser Cys Lys Glu 
965 970 975 980 

ATC GCT GTT TCA GTG GTG AGC GGG GTG GTG ATC ATC ATT GTG TTT TTT 1344 
He Ala Val Ser Val Val Ser Gly Val Val He He He Val Phe Phe 
985 990 995 

GTG CCG ATT TTA ACC TTA CAG GGG TTA GAG GGT AAG ATG TTT AGG CCT 13 92 

Val Pro He Leu Thr Leu Gin Gly Leu Glu Gly Lys Met Phe Arg Pro 
1000 1005 1010 

TTA GCG CAA AGC ATT GTG TAT GCG CTT TTA GGC ACT TTA GTT CTA TCT 1440 
Leu Ala Gin Ser He Val Tyr Ala Leu Leu Gly Thr Leu Val Leu Ser 
1015 1020 1025 

ATT ACA ATC ATT CCT GTA GTC AGC TCT CTT GTC TTA AAA GCC ACG CCC 1488 
He Thr He He Pro Val Val Ser Ser Leu Val Leu Lys Ala Thr Pro 
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1030 1035 1040 

CAT AGC GAA ACC TTT TTA ACG AGG TTT TTA AAC AGA ATC TAC GCC CCT 1536 
His Ser Glu Thr Phe Leu Thr Arg Phe Leu Asn Arg lie Tyr Ala Pro 
1045 1050 1055 1060 

TTA TTG GAA TTT TTT GTG CAT AAC CCT AAA AAA GTG ATT TTA GGA GCG 1584 
Leu Leu Glu Phe Phe Val His Asn Pro Lys Lys Val He Leu Gly Ala 
1065 1070 1075 

TTT GTT TTT TTA ATC GCA AGC CTT TCT TTA TTC CCT TTT GTG GGG AAG 1632 
Phe Val Phe Leu He Ala Ser Leu Ser Leu Phe Pro Phe Val Gly Lys 
1080 1085 1090 

AAT TTC ATG CCC GTT TTA GAT GAG GGC GAT GTG GTT TTG AGC GTG GAA 16 80 

Asn Phe Met Pro Val Leu Asp Glu Gly Asp Val Val Leu Ser Val Glu 
1095 HOO 1105 

ACC ACC CCT TCT ATT TCT TTA GAT CAA TCT AGG GAT CTC ATG CTA AAC 1728 
Thr Thr Pro Ser He Se-r Leu Asp Gin Ser Arg Asp Leu Met Leu Asn 
1110 1115 1120 

ATT GAG AGC GCG ATT AAA AAG CAT GTC AAG GAA GTT AAA AGC ATT GTC 1776 
He Glu Ser Ala He Lys Lys His Val Lys Glu Val Lys Ser He Val 
1125 1130 H35 1140 

GCG CGC ACA GGG AGC GAT GAA TTG GGG CTG GAT TTA GGA GGT TTG AAT 1824 
Ala Arci Thr Gly Ser Asp Glu Leu Gly Leu Asp Leu Gly Gly Leu Asn 
1145 1150 1155 

CAA ACC GAT ACT TTT ATT TCT TTT ATT CCT AAA AAA GAA TGG AGC GTT 1872 
Gin Thr Asp Thr Phe He Ser Phe He Pro Lys Lys Glu Trp Ser Val 
1160 H65 . 1170 

AAA ACC AAA GAT GAA TTA TTA GAA AAA ATC ATG GAT TCT TTA AAA GAC 1920 
Lvs Thr Lys Asp Glu Leu Leu Glu Lys He Met Asp Ser Leu Lys Asp 
y 1175 1180 1185 

TTT AAG GGG ATT AAC TTT TCT TTC ACC CAA CCC ATT GAA ATG AGA ATT 1968 
Phe Lys Gly He Asn Phe Ser Phe Thr Gin Pro He Glu Met Arg He 
1190 1195 1200 

TCT GAA ATG CTG ACA GGG GTT AGG GGG GAT TTA GCG GTT AAG ATT TTT 2016 
Ser Glu Met Leu Thr Gly Val Arg Gly Asp Leu Ala Val Lys He Phe 
1205 1210 1215 1220 

GGA GAT GGT ATT AGC GAA TTG AAT GAA TTG AGT TTT CAA ATC GCG CAA 2064 
Glv Asp Gly He Ser Glu Leu Asn Glu Leu Ser Phe Gin He Ala Gin 
1225 1230 1235 

OCT CTA AAA GGG ATT AAA GGA TCT AGT GAA GTT TTA ACC ACG CTT AAT 2112 
Ala Leu Lvs Gly He Lvs Glv Ser Ser Glu Val Leu Thr Thr Leu Asn 
~ 1240 " " 1245 1250 

GAG GGC GTG AAT TAT TTG TAT GTA ACC CCT AAT AAA GAA TCG ATG GCG 2160 
Glu Gly Val Asn Tyr Leu Tyr Val Thr Pro Asn Lys Glu Ser Met Ala 
1255 1260 1265 

GAT GTG GGG ATC ACT AGC GAT GAA TTT TCC AAG TTT TTA AAA TCC GCT 2208 
Asp Val Gly He Thr Ser Asp Glu Phe Ser Lys Phe Leu Lys Ser Ala 
1270 1275 1280 
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TTA GAG GGC TTG GTT GTA GAT GTG ATC CCT ACA GGG ATT TCA CGC ACG 2256 
Leu Glu Gly Leu Val Val Asp Val lie Pro Thr Gly lie Ser Arg Thr 
1285 1290 1295 1300 

CCA GTG ATG ATC CGC CAA GAG AGC GAT TTT GCA AGC TCT ATC ACT AAA 23 04 

Pro Val Met He Arg Gin Glu Ser Asp Phe Ala Ser Ser He Thr Lys 
1305 1310 1315 

ATC AAA AGT TTA GCC TTG ACT TCA AAA TAT GGC GTT TTA GTG CCT ATC 2352 
He Lys Ser Leu Ala Leu Thr Ser Lys Tyr Gly Val Leu Val Pro He 
1320 1325 1330 

ACT TCT ATC GCC AAA ATT GAA GAA GTG GAT GGC CCT GTT TCT GTT GTG 24 0 0 

Thr Ser He Ala Lys He Glu Glu Val Asp Gly Pro Val Ser Val Val 
1335 1340 1345 

CGT GAA AAT TCA ATG CGC ATG AGC GTG GTT CGC AGT AAT GTG GTG GGG 2448 
Arg Glu Asn Ser Met Arg Met Ser Val Val Arg Ser Asn Val Val Gly 
1350 1355 1360 

CGC GAT TTG AAA TCT TTT GTA GAA GAG GCT AAA AAA GTG ATC GCT CAA 2496 
Arg Asp Leu Lys Ser Phe Val Glu Glu Ala Lys Lys Val He Ala Gin 
1365 1370 1375 1380 

AAC ATC AAA CTC CCT CCC AGC TAC TAT ATC ACT TAT GGG GGG CAG TTT 2544 
Asn He Lys Leu Pro Pro Ser Tyr Tyr He Thr Tyr Gly Gly Gin Phe 
1385 1390 1395 

GAA AAC CAG CAA CGG GCC AAT AAA AGG CTC TCC ACC GTT ATC CCT TTA 2592 
Glu Asn Gin Gin Arg Ala Asn Lys Arg Leu Ser Thr Val He Pro Leu 
1400 1405 1410 

AGC ATC TTA GCG ATT TTT TTC ATT CTT TTT TTC ACT TTT AAA AGC ATT 2640 
Ser He Leu Ala He Phe Phe He Leu Phe Phe Thr Phe Lys Ser He 
1415 1420 1425 

CCT TTA GCC TTG CTC ATT CTT TTG AAT ATC CCT TTT GCG GTT ACC GGA 2688 
Pro Leu Ala Leu Leu He Leu Leu Asn He Pro Phe Ala Val Thr Gly 
1430 1435 1440 

GGC CTT ATT GCG TTG TTT GCG GTC GGG GAG TAT ATT TCA GTG CCA GCG 2736 
Gly Leu He Ala Leu Phe Ala Val Gly Glu Tyr He Ser Val Pro Ala 
1445 1450 1455 1460 

AGC GTG GGC TTT ATC GCT CTT TTT GGG ATT GCG GTT TTA AAT GGC GTG 2784 
Ser Val Gly Phe He Ala Leu Phe Gly He Ala Val Leu Asn Gly Val 
1465 1470 1475 

GTG ATG ATA GGC TAT TTT AAA GAG CTT CTC TTG CAA GGG AAA AGC GTA 2832 
Val Met He Gly Tyr Phe Lys Glu Leu Leu Leu Gin Gly Lys Ser Val 
1480 1485 1490 

GAA GAA TGC GTT TTA TTG GGC GCT AAA AGG CGT TTG AGA CCG GTT TTA 2 880 

Glu Glu Cys Val Leu Leu Gly Ala Lys Arg Arg Leu Arg Pro Val Leu 
1495 1500 1505 

ATG ACC GCT TGC ATT GCC GGT TTG GGT TTG CTC CCT TTA TTA TTT TCT 2928 
Met Thr Ala Cys He Ala Gly Leu Gly Leu Leu Pro Leu Leu Phe Ser 
1510 1515 1520 

CAT AGC GTG GGA TCA GAA GTC CAA AAA CCT TTA GCG ATC GTG GTG CTT 2976 
His Ser Val Gly Ser Glu Val Gin Lys Pro Leu Ala He Val Val Leu 
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1525 1530 1535 1540 

GGA GGC TTG GTT ACC TCA AGC GCT CTA ACC TTA CTC CTA CTG CCG CCA 3024 
Glv Glv Leu Val Thr Ser Ser Ala Leu Thr Leu Leu Leu Leu Pro Pro 
1 1545 1550 1555 

ATG TTT ATG CTC ATC GCT AAA AAG ATT AAA ATC GTT TGA 3063 
Met Phe Met Leu lie Ala Lys Lys lie Lys lie Val * 
1560 1565 

(2) ANGABEN ZU SEQ ID NO: 102: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 1021 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DBS MOLEKUXS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 102: 

Met Met Leu Ala Ser He He Glu Phe Ser Leu Arg Gin Arg Val He 
15 10 15 

Val He Val Gly Ala He Leu He Leu Phe Phe Gly Thr Tyr Ser Phe 
20 25 30 

He Asn Thr Pro Val Asp Ala Phe Pro Asp He Ser Pro Thr Gin Val 
35 40 45 

Lys He He Leu Lys Leu Pro Gly Ser Ser Pro Glu Glu Met Glu Asn 
50 55 60 

Asn He Val Arg Pro Leu Glu Leu Glu Leu Leu Gly Leu Lys Gly Gin 
65 70 75 80 

Lvs Ser Leu Arg Ser Val Ser Lys Tyr Ser He Ser Asp He Thr He 
* 85 90 95 

Asp Phe Asp Asp Ser Val Asp He Tyr Leu Ala Arg Asn He Val Asn 
100 105 HO 

Glu Arg Leu Ser Ser Val Met Lys Asp Leu Pro Val Gly Val Glu Gly 
115 120 125 

Gly Met Ala Pro He Val Thr Pro Leu Ser Asp He Phe Met Phe Thr 
130 135 140 

He Asp Gly Asn He Thr Glu He Glu Lys Arg Gin Leu Leu Asp Phe 
145 150 155 160 

Val He Ara Pro Gin Leu Arg Met He Ser Gly Val Ala Asp Val Asn 
165 170 175 

Ser He Gly Gly Phe Ser Arg Ala Phe Val He Val Pro Asp Phe Asn 
- — 185 190 



180 



Asp Met Ala Arg Leu Gly Val Ser He Ser Asp Leu Glu Ser Ala Val 
195 200 205 

Arg Val Asn Leu Arg Asn Ser Gly Ala Gly Arg Val Asp Arg Asp Gly 
210 215 220 
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Glu Thr Phe Leu Val Lys lie Gin Thr Ala Ser Leu Ser Leu Glu Asp 
225 230 235 240 

lie Gly Lys lie Thr Val Ser Thr Asn Leu Gly His Leu His lie Lys 
245 250 255 

Asp Phe Ala Lys Val lie Ser Gin Ser Arg Thr Arg Leu Gly Phe Val 
260 265 270 

Thr Lys Asp Gly Val Gly Glu Thr Thr Glu Gly Leu Val Leu Ser Leu 
275 280 285 

Lys Asp Ala Asn Thr Lys Glu He He Thr Gin Val Tyr Gin Lys Leu 
290 295 300 

Glu Glu Leu Lys Pro Phe Leu Pro Asn Gly Val Ser He Asn Val Phe 
305 310 315 320 

Tyr Asp Arg Ser Glu Phe Thr Gin Lys Ala He Ala Thr Val Ser Lys 
* 325 330 335 

Thr Leu He Glu Ala Val Val Leu He He He Thr Leu Phe Leu Phe 
340 345 350 

Leu Gly Asn Leu Arg Ala Ser Val Ala Val Gly Val He Leu Pro Leu 
355 360 365 

Ser Leu Ser Val Ala Phe He Phe He Lys Phe Ser Asp Leu Thr Leu 
370 375 380 

Asn Leu Met Ser Leu Gly Gly Leu Val He Ala He Gly Met Leu He 
385 390 395 400 

Asp Ser Ala Val Val Val Val Glu Asn Ala Phe Glu Lys Leu Ser Ala 
405 410 415 

Asn Thr Lys Thr Thr Lys Leu His Ala He Tyr Arg Ser Cys Lys Glu 
420 425 430 

He Ala Val Ser Val Val Ser Gly Val Val He He He Val Phe Phe 
435 440 445 

Val Pro He Leu Thr Leu Gin Gly Leu Glu Gly Lys Met Phe Arg Pro 
450 455 460 

Leu Ala Gin Ser He Val Tyr Ala Leu Leu Gly Thr Leu Val Leu Ser 
465 470 475 480 

He Thr He He Pro Val Val Ser Ser Leu Val Leu Lys Ala Thr Pro 
485 490 495 

His Ser Glu Thr Phe Leu Thr Arg Phe Leu Asn Arg He Tyr Ala Pro 
500 505 510 

Leu Leu Glu Phe Phe Val His Asn Pro Lys Lys Val He Leu Gly Ala 
515 520 525 

Phe Val Phe Leu He Ala Ser Leu Ser Leu Phe Pro Phe Val Gly Lys 
530 535 540 

Asn Phe Met Pro Val Leu Asp Glu Gly Asp Val Val Leu Ser Val Glu 
545 550 . 555 560 
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Thr Thr Pro Ser lie Ser Leu Asp Gin Ser Arg Asp Leu Met Leu Asn 
565 570 575 

lie Glu Ser Ala lie Lys Lys His Val Lys Glu Val Lys Ser lie Val 
580 585 590 

Ala Arg Thr Gly Ser Asp Glu Leu Gly Leu Asp Leu Gly Gly Leu Asn 
595 600 60S 

Gin Thr Asp Thr Phe lie Ser Phe lie Pro Lys Lys Glu Trp Ser Val 
610 615 620 

Lys Thr Lys Asp Glu Leu Leu Glu Lys lie Met Asp Ser Leu Lys Asp 
625 630 635 640 

Phe Lys Gly lie Asn Phe Ser Phe Thr Gin Pro He Glu Met Arg He 
645 650 655 

Ser Glu Met Leu Thr Gly Val Arg Gly Asp Leu Ala Val Lys He Phe 
660 665 670 

Gly Asp Gly He Ser Glu Leu Asn Glu Leu Ser Phe Gin He Ala Gin 
675 680 685 

Ala Leu Lys Gly He Lys Gly Ser Ser Glu Val Leu Thr Thr Leu Asn 
690 695 700 

Glu Gly Val Asn Tyr Leu Tyr Val Thr Pro Asn Lys Glu Ser Met Ala 
705 710 715 720 

Asp Val Gly He Thr Ser Asp Glu Phe Ser Lys Phe Leu Lys Ser Ala 
725 730 735 

Leu Glu Gly Leu Val Val Asp Val He Pro Thr Gly He Ser Arg Thr 
740 745 750 

Pro Val Met He Arg Gin Glu Ser Asp Phe Ala Ser Ser He Thr Lys 
755 760 765 

He Lys Ser Leu Ala Leu Thr Ser Lys Tyr Gly Val Leu Val Pro He 
770 775 780 

Thr Ser He Ala Lys He Glu Glu Val Asp Gly Pro Val Ser Val Val 
785 790 795 800 

Arg Glu Asn Ser Met Arg Met Ser Val Val Arg Ser Asn Val Val Gly 
805 810 815 

Arq Asp Leu Lys Ser Phe Val Glu Glu Ala Lys Lys Val He Ala Gin 
820 825 830 

Asn He Lys Leu Pro Pro Ser Tyr Tyr He Thr Tyr Gly Gly Gin Phe 
835 840 845 

Glu Asn Gin Gin Arg Ala Asn Lys Arg Leu Ser Thr Val He Pro Leu 
850 855 860 

Ser He Leu Ala He Phe Phe He Leu Phe Phe Thr Phe Lys Ser He 
865 870 875 880 

Pro Leu Ala Leu Leu He Leu Leu Asn He Pro Phe Ala Val Thr Gly 
885 890 895 
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Gly Leu lie Ala Leu Phe Ala Val Gly Glu Tyr lie Ser Val Pro Ala 
900 905 910 

Ser Val Gly Phe lie Ala Leu Phe Gly lie Ala Val Leu Asn Gly Val 
915 920 925 

Val Met lie Gly Tyr Phe Lys Glu Leu Leu Leu Gin Gly Lys Ser Val 
930 935 940 

Glu Glu Cys Val Leu Leu Gly Ala Lys Arg Arg Leu Arg Pro Val Leu 
945 950 955 960 

Met Thr Ala Cys lie Ala Gly Leu Gly Leu Leu Pro Leu Leu Phe Ser 
965 970 975 

His Ser Val Gly Ser Glu Val Gin Lys Pro Leu Ala lie Val Val Leu 
980 985 990 

Gly Gly Leu Val Thr Ser Ser Ala Leu Thr Leu Leu Leu Leu Pro Pro 
995 1000 1005 

Met Phe Met Leu lie Ala Lys Lys He Lys He Val * 
1010 1015 1020 

(2) ANGABEN ZU SEQ ID NO: 103: 

<i) S EQUENZ KENNZE I CHEN : 

(A) LANGE: 2028 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT: 
(B) CLON(E) : HPS149 

(ix) MERKMAL: 

(A) NAME/ SCHLUSSEL : CDS 

(B) LAGE:1..2028 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 103: 

TTG TCT AAA GGT TTG AGT ATC GGT AAT AAA ATC ATA TTG TGC GTG GCG 48 
Leu Ser Lys Gly Leu Ser He Gly Asn Lys lie He Leu Cys Val Ala 
1025 1030 1035 

TTG ATT GTG ATC GTG TGC GTG AGC ATT TTA GGG GTG TCC TTA AAC AGC 96 
Leu He Val He Val Cys Val Ser He Leu Gly Val Ser Leu Asn Ser 
1040 1045 1050 

AGG GTG AAA GAG ATT TTA AAA GAA AGC GCT CTG CAT TCT ATG CAA GAT 144 
Arg Val Lys Glu He Leu Lys Glu Ser Ala Leu His Ser Met Gin Asp 
1055 1060 1065 

AGT TTG CAT TTT AAG GTT AAT GAA GTG CAA GGG GTT TTA GAA AAC ACT 192 
Ser Leu His Phe Lys Val Asn Glu Val Gin Gly Val Leu Glu Asn Thr 
1070 1075 1080 1085 

TAT ACG AGC ATG GGC ATT GTT AAA GAA ATG CTC CCT AAA GAC ACC AAA 240 
Tyr Thr Ser Met Gly He Val Lys Glu Met Leu Pro Lys Asp Thr Lys 
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1090 1095 1100 

AGA GAA ATC AAA ATC GGC TTG TTA AAA AAC TTC ATT TTA GCC AAT TCG 288 
Ara Glu lie Lys lie Gly Leu Leu Lys Asn Phe lie Leu Ala Asn Ser 
1105 1110 1115 

CAT GTC GCT GGG GTG AGC ATG TTT TTT AAA GGC AGA GAA GAT TTA AGA 336 
His Val Ala Gly Val Ser Met Phe Phe Lys Gly Arg Glu Asp Leu Arg 
1120 1125 1130 

TTA ACG CTT TTA AGG GAT AAC AAT ACG ATT AAG CTA GTG GAA AAT CCG 384 
Leu Thr Leu Leu Arg Asp Asn Asn Thr lle Lys Leu Val Glu Asn Pro 
1135 1140 1145 

TCA TTA GAG AAT AGC CCT TTA GCG GAA AAA GCG ATG AAA AAT AAA GAA 432 
Ser Leu Glu Asn Ser Pro Leu Ala Gin Lys Ala Met Lys Asn Lys Glu 
1150 1155 1160 1165 

ATT TCT AAA AGT TTG GGT TAT TAT AGG AAA ATG CCT AAT GGG GCG GAA 480 
lie Ser Lys Ser Leu Gly Tyr Tyr Arg Lys Met Pro Asn Gly Ala Glu 
1170 1175 1180 

GTT TAT GGG GTG GAT ATT CTT TTA CCT TTA TTG AAT GAG AAC GCT CAA 528 
Val Tyr Gly Val Asp lie Leu Leu Pro Leu Leu Asn Glu Asn Ala Gin 
1185 1190 1195 

GAG GTT GTA GGG GCT TTG ATG ATT TTT ATT TCC ATT GAC AGC TTC AGC 576 
Glu Val Val Gly Ala Leu Met lie Phe lie Ser lie Asp Ser Phe Ser 
1200 1205 1210 

AAT GAA ATC ACT AAA AAC AGG AGC GAT TTA TTT TTA ATT GGC ACT AAA 624 
Asn Glu lie Thr Lys Asn Arg Ser Asp Leu Phe Leu lie Gly Thr Lys 
1215 1220 1225 

GGT AAA GTG CTT TTG AGC GCG AAT AAG AGT TTG CAA GAC AAA CCT ATC 672 
Gly Lys Val Leu Leu Ser Ala Asn Lys Ser Leu Gin Asp Lys Pro lie 
1230 1235 1240 1245 

GCA GAA ATT TAT AAG AGC GTG CCT AAA GCC ACC AAC GAA GTG ATG GCT 720 
Ala Glu lie Tyr Lys Ser Val Pro Lys Ala Thr Asn Glu Val Met Ala 
1250 1255 1260 

ATT TTA GAA AAC GGC TCT AAA GCG ACT TTA GAA TAC TTA GAT CCC TTT 768 
lie Leu Glu Asn Gly Ser Lys Ala Thr Leu Glu Tyr Leu Asp Pro Phe 
1265 1270 1275 

AGC CAT AAG GAA AAT TTT TTA GCC GTT GAA ACC TTT AAA ATG CTA GGC 816 
Ser His Lys Glu Asn Phe leu Ala Val Glu Thr Phe Lys Met Leu Gly 
1280 1285 1290 

AAA ACA GAA AGT AAA GAC AAT CTT AAT TGG ATG ATC GCT TTA ATC ATT 864 
Lys Thr Glu Ser Lys Asp Asn Leu Asn Trp Met lie Ala Leu lie lie 
1295 1300 1305 

GAA AAA GAC AAG GTC TAT GAG CAA GTA GGC TCG GTG CGT TTT GTG GTG 912 
Glu Lys Asp Lys Val Tyr Glu Gin Val Gly Ser Val Arg Phe Val Val 
1310 1315 1320 1325 

ATC ATA GCG AGC GCA ATC ATG GTG TTA GCC TTG ATT ATA GCG ATC ACT 960 
lie lie Ala Ser Ala lie Met Val Leu Ala Leu lie lie Ala lie Thr 
1330 1335 1340 
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CTC TTA ATG CGA GCG ATC GTG AGC AGT CGT TTG GAA GCC GTT TCT AGC 1008 
Leu Leu Met Arg Ala He Val Ser Ser Arg Leu Glu Ala Val Ser Ser 
1345 1350 1355 

ACC TTG TCT CAT TTC TTT AAA TTA TTG AAC AAT CAA GCC AAT TCT AGC 1056 
Thr Leu Ser His Phe Phe Lys Leu Leu Asn Asn Gin Ala Asn Ser Ser 
1360 1365 1370 

GGT ATT AAA TTG ATT GAA GCG AAA TCC AAT GAC GAG TTA GGC CGC ATG 1104 
Gly He Lys Leu lie Glu Ala Lys Ser Asn Asp Glu Leu Gly Arg Met 
1375 1380 1385 

CAA ACA GCG ATC AAT AAA AAT ATC TTG CAA ACC CAA AAA ATC ATG CAA 1152 
Gin Thr Ala lie Asn Lys Asn He Leu Gin Thr Gin Lys He Met Gin 
1390 1395 1400 1405 

GAA GAC AGG CAA GCC GTC CAA GAC ACC ATT AAA GTG GTT TCA GAT GTG 12 00 

Glu Asp Arg Gin Ala Val Gin Asp Thr He Lys Val Val Ser Asp Val 
1410 1415 1420 

AAA GCA GGG AAT TTT GCG GTG CGC ATC ACG GCT GAG CCC GCA AGC CCT 1248 
Lys Ala Gly Asn Phe Ala Val Arg He Thr Ala Glu Pro Ala Ser Pro 
1425 1430 1435 

GAT TTG AAA GAA TTG AGG GAC GCG CTA AAT GGG ATC ATG GAT TAT TTG 1296 
Asp Leu Lys Glu Leu Arg Asp Ala Leu Asn Gly He Met Asp Tyr Leu 
1440 1445 1450 

CAA GAA AGC GTA GGG ACT CAC ATG CCA AGC ATT TTC AAA ATC TTT GAA 1344 
Gin Glu Ser Val Gly Thr His Met Pro Ser lie Phe Lys He Phe Glu 
1455 1460 1465 

AGC TAT TCT GGT TTG GAT TTT AGA GGC CGG ATC CAA AAC GCT TCG GGT 1392 
Ser Tyr Ser Gly Leu Asp Phe Arg Gly Arg He Gin Asn Ala Ser Gly 
1470 1475 1480 1485 

AGG GTG GAA CTG GTT ACT AAC GCT TTA GGG CAA GAA ATC CAA AAA ATG 1440 
Arg Val Glu Leu Val Thr Asn Ala Leu Gly Gin Glu He Gin Lys Met 
1490 1495 1500 

CTA GAA ACT TCG TCT AAT TTT GCC AAA GAT TTA GCG AAC GAT AGC GCG 1488 
Leu Glu Thr Ser Ser Asn Phe Ala Lys Asp Leu Ala Asn Asp Ser Ala 
1505 1510 1515 

AAT TTA AAA GAG TGC GTG CAA AAT TTA GAA AAA GCT TCA AAC TCC CAA 1536 
Asn Leu Lys Glu Cys Val Gin Asn Leu Glu Lys Ala Ser Asn Ser Gin 
1520 1525 1530 

CAC AAA AGC TTG ATG GAA ACT TCC AAA ACG ATA GAA AAT ATC ACC ACT 1584 
His Lys Ser Leu Met Glu Thr Ser Lys Thr He Glu Asn He Thr Thr 
1535 1540 1545 

TCC ATT CAA GGC GTG AGC TCT CAA AGT GAA GCC ATG ATT GAA CAA GGG 1632 
Ser He Gin Gly Val Ser Ser Gin Ser Glu Ala Met He Glu Gin Gly 
1550 1555 1560 1565 

CAA GAC ATT AAA AGC ATT GTA GAA ATC ATT AGA GAT ATT GCT GAT CAA 1680 
Gin Asp He Lys Ser He Val Glu He He Arg Asp He Ala Asp Gin 
1570 1575 1580 

ACC AAT CTT TTA GCC TTA AAC GCC GCT ATT GAA GCC GCA AGG GCC GGC 172 8 

Thr Asn Leu Leu Ala Leu Asn Ala Ala He Glu Ala Ala Arg Ala Gly 
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1585 1590 1595 

GAG CAT GGC AGA GGC TTT GCG GTG GTG GCT GAT GAG GTA AGA AAG CTC 1776 
Glu His Gly Arg Gly Phe Ala Val Val Ala Asp Glu Val Arg Lys Leu 
1600 1605 1610 

GCT GAA AGG ACG CAA AAA TCG CTC AGC GAG ATT GAA GCC AAT ATC AAT 1824 
Ala Glu Arg Thr Gin Lys Ser Leu Ser Glu He Glu Ala Asn He Asn 
1615 1620 1625 

ATT TTA GTG CAA AGC ATT TCA GAC ACG AGC GAA AGC ATT AAA AAC CAG . 1872 

He Leu Val Gin Ser He Ser Asp Thr Ser Glu Ser He Lys Asn Gin 
1630 1635 1640 1645 

GTT AAA GAA GTG GAA GAA ATC AAC GCT TCT ATT GAA GCC TTA AGA TCG 1920 
Val Lys Glu Val Glu Glu He Asn Ala Ser He Glu Ala Leu Arg Ser 
1650 1655 1660 

GTT ACT GAG GGC AAT CTA AAA ATC GCT AGC GAT TCT TTA GAA ATC AGT 1968 
Val Thr Glu Gly Asn Leu Lys He Ala Ser Asp Ser Leu Glu He Ser 
1665 1670 1675 

CAA GAA ATT GAC AAA GTT TCT AAC GAT ATT TTA GAA GAT GTG AAT AAA 2016 
Gin Glu He Asp Lys Val Ser Asn Asp He Leu Glu Asp Val Asn Lys 
1680 1685 1690 



AAG CAG TTT TAA 
Lys Gin Phe * 
1695 

(2) ANGABEN ZU SEQ ID NO: 104: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 676 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 104: 

Leu Ser Lys Gly Leu Ser He Gly Asn Lys He He Leu Cys Val Ala 
I S 10 15 

Leu He Val He Val Cys Val Ser He Leu Gly Val Ser Leu Asn Ser 
20 25 30 

Arg Val Lys Glu He Leu Lys Glu Ser Ala Leu His Ser Met Gin Asp 
35 40 45 

Ser Leu His Phe Lys Val Asn Glu Val Gin Gly Val Leu Glu Asn Thr 
50 55 60 

Tyr Thr Ser Met Gly He Val Lys Glu Met Leu Pro Lys Asp Thr Lys 
65 70 75 80 

Arg Glu He Lys He Gly Leu Leu Lys Asn Phe He Leu Ala Asn Ser 
85 90 95 

His Val Ala Gly Val Ser Met Phe Phe Lys Gly Arg Glu Asp Leu Arg 
100 105 110 



2028 
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Leu Thr Leu Leu Arg Asp Asn Asn Thr lie Lys Leu Val Glu Asn Pro 
115 120 125 

Ser Leu Glu Asn Ser Pro Leu Ala Gin Lys Ala Met Lys Asn Lys Glu 
130 135 140 

lie Ser Lys Ser Leu Gly Tyr Tyr Arg Lys Met Pro Asn Gly Ala Glu 
145 150 155 160 

Val Tyr Gly Val Asp lie Leu Leu Pro Leu Leu Asn Glu Asn Ala Gin 
165 170 175 

Glu Val Val Gly Ala Leu Met lie Phe lie Ser lie Asp Ser Phe Ser 
180 185 190 

Asn Glu lie Thr Lys Asn Arg Ser Asp Leu Phe Leu lie Gly Thr Lys 
195 200 205 

Gly Lys Val Leu Leu Ser Ala Asn Lys Ser Leu Gin Asp Lys Pro lie 
210 215 220 

Ala Glu He Tyr Lys Ser Val Pro Lys Ala Thr Asn Glu Val Met Ala 
225 230 235 240 

lie Leu Glu Asn Gly Ser Lys Ala Thr Leu Glu Tyr Leu Asp Pro Phe 
245 250 255 

Ser His Lys Glu Asn Phe Leu Ala Val Glu Thr Phe Lys Met Leu Gly 
260 265 270 

Lys Thr Glu Ser Lys Asp Asn Leu Asn Trp Met He Ala Leu He He 
275 280 285 

Glu Lys Asp Lys Val Tyr Glu Gin Val Gly Ser Val Arg Phe Val Val 
290 295 300 

He He Ala Ser Ala He Met Val Leu Ala Leu He He Ala He Thr 
305 310 315 320 

Leu Leu Met Arg Ala He Val Ser Ser Arg Leu Glu Ala Val Ser Ser 
325 330 335 

Thr Leu Ser His Phe Phe Lys Leu Leu Asn Asn Gin Ala Asn Ser Ser 
340 345 350 

Gly He Lys Leu lie Glu Ala Lys Ser Asn Asp Glu Leu Gly Arg Met 
355 360 365 

Gin Thr Ala He Asn Lys Asn He Leu Gin Thr Gin Lys He Met Gin 
370 375 380 

Glu Asp Arg Gin Ala Val Gin Asp Thr lie Lys Val Val Ser Asp Val 
385 390 395 400 

Lys Ala Gly Asn Phe Ala Val Arg He Thr Ala Glu Pro Ala Ser Pro 
405 410 415 

Asp Leu Lys Glu Leu Arg Asp Ala Leu Asn Gly He Met Asp Tyr Leu 
420 425 430 

Gin Glu Ser Val Gly Thr His Met Pro Ser He Phe Lys He Phe Glu 
435 440 445 
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Ser Tyr Ser Gly Leu Asp Phe Arg Gly Arg He Gin Asn Ala Ser Gly 
450 455 460 

Arg Val Glu Leu Val Thr Asn Ala Leu Gly Gin Glu He Gin Lys Met 
465 470 475 480 

Leu Glu Thr Ser Ser Asn Phe Ala Lys Asp Leu Ala Asn Asp Ser Ala 
485 490 495 

Asn Leu Lys Glu Cys Val Gin Asn Leu Glu Lys Ala Ser Asn Ser Gin 
500 505 510 

His Lys Ser Leu Met Glu Thr Ser Lys Thr He Glu Asn He Thr Thr 
515 520 525 

Ser He Gin Gly Val Ser Ser Gin Ser Glu Ala Met He Glu Gin Gly 
530 535 540 

Gin Asp He Lys Ser He Val Glu He He Arg Asp He Ala Asp Gin 
545 550 555 560 

Thr Asn Leu Leu Ala Leu Asn Ala Ala He Glu Ala Ala Arg Ala Gly 
565 570 575 

Glu His Gly Arg Gly Phe Ala Val Val Ala Asp Glu Val Arg Lys Leu 
580 585 590 

Ala Glu Arg Thr Gin Lys Ser Leu Ser Glu He Glu Ala Asn He Asn 
595 600 605 

He Leu Val Gin Ser He Ser Asp Thr Ser Glu Ser He Lys Asn Gin 
610 615 620 

Val Lys Glu Val Glu Glu He Asn Ala Ser He Glu Ala Leu Arg Ser 
625 630 635 640 

Val Thr Glu Gly Asn Leu Lys He Ala Ser Asp Ser Leu Glu He Ser 
645 650 655 

Gin Glu He Asp Lys Val Ser Asn Asp He Leu Glu Asp Val Asn Lys 
660 665 670 

Lys Gin Phe * 
675 

(2) ANGABEN ZU SEQ ID NO: 105: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 273 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT : 
(B) CLON(E) : HPS161 



(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE:1..273 
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(xi) SEQUENZBESCHREIBUNG : SEQ ID NO: 105: 

GTG GCG GTG AAA AAA ATC GTT GTG AGT TGG TGT GTG GCG TTG GCT TTT 48 
Val Ala Val Lys Lys lie Val Val Ser Trp Cys Val Ala Leu Ala Phe 
680 685 690 

TTA AGC GCG GAT TCA GCA CAA GCC AAT AAA GCG ATC AGT AAT GCG GAT 96 
Leu Ser Ala Asp Ser Ala Gin Ala Asn Lys Ala lie Ser Asn Ala Asp 
695 700 705 

TTG ATT AAA GAG ATA AGG GAT TTA AAA AAA ATC ATC AGC GCG CAA AAC 144 
Leu lie Lys Glu lie Arg Asp Leu Lys Lys lie lie Ser Ala Gin Asn 
710 715 720 

ACT GAG ATT AAC AAC TTA AGA AAA GTG CAA GAA GTG TTG TCT GGG CAA 192 
Thr Glu lie Asn Asn Leu Arg Lys Val Gin Glu Val Leu Ser Gly Gin 
725 730 735 740 

TTA GGG GAC ATG CGT AAG GAT ATA TTA AGC ACT AGA GAT TAT TGC ATT 240 
Leu Gly Asp Met Arg Lys Asp lie Leu Ser Thr Arg Asp Tyr Cys lie 
745 750 755 

AGC TTA AGG CCT TAT ATC TAT AAT TGG CGC TAG 273 
Ser Leu Arg Pro Tyr lie Tyr Asn Trp Arg * 
760 765 

(2) ANGABEN ZU SEQ ID NO: 106: 

( i ) SEQUENZKENNZE I CHEN : 

(A) LANGE: 91 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 106: 

Val Ala Val Lys Lys lie Val Val Ser Trp Cys Val Ala Leu Ala Phe 
15 10 15 

Leu Ser Ala Asp Ser Ala Gin Ala Asn Lys Ala lie Ser Asn Ala Asp 
20 25 30 

Leu lie Lys Glu lie Arg Asp Leu Lys Lys He He Ser Ala Gin Asn 
35 40 45 

Thr Glu He Asn Asn Leu Arg Lys Val Gin Glu Val Leu Ser Gly Gin 
50 55 60 

Leu Gly Asp Met Arg Lys Asp He Leu Ser Thr Arg Asp Tyr Cys He 
65 70 75 80 

Ser Leu Arg Pro Tyr He Tyr Asn Trp Arg * 

85 90 



(2) ANGABEN ZU SEQ ID NO: 107: 



(i) SEQUENZKENNZE ICHEN : 

(A) LANGE: 759 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE : linear 
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(vii) UNM I TTE LB ARE HERKUNFT: 
(B) CLON(E) : HPS176 

(ix) MERKMAL: 

(A) NAME/ SCHLUSSEL : CDS 

(B) LAGE : 1 . .759 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 107: 

ATG TTA GGG AAA AAA AAC GAA GAA GTC TTG ATT GAT GAA AAT TTG GTT 48 
Met Leu Gly Lys Lys Asn Glu Glu Val Leu lie Asp Glu Asn Leu Val 
95 100 105 

GGG GGT GTG ATA GCC CTT GAT AGA TTG GCA AAA CTC AAT AAG GCC AAT 96 
Gly Gly Val lie Ala Leu Asp Arg Leu Ala Lys Leu Asn Lys Ala Asn 
110 115 120 

AGG ACT TTC AAA AGG GCT TTT TAT CTC TCT ATG GCA CTC AAT GTC GCC 144 
Arg Thr Phe Lys Arg Ala Phe Tyr Leu Ser Met Ala Leu Asn Val Ala 
125 130 135 

GCT GTA ACG AGT ATT GTG ATG ATG ATG CCT TTG AAG AAA ACG GAT ATA 192 
Ala Val Thr Ser He Val Met Met Met Pro Leu Lys Lys Thr Asp He 
140 145 150 155 

TTT GTT TAT GGC ATT GAT CGA TAC ACA GGA GAA TTT AAA ATT GTC AAA 240 
Phe Val Tyr Gly He Asp Arg Tyr Thr Gly Glu Phe Lys He Val Lys 
160 165 170 

CGC TCC GAT GCT AGG CAA ATC GTC AAT TCT GAA GCC GTT GTG GAT AGT 288 
Arg Ser Asp Ala Arg Gin He Val Asn Ser Glu Ala Val Val Asp Ser 
175 180 185 

GCA ACT TCA AAA TTT GTA TCA TTG CTG TTT GGT TAT AGC AAA AAT TCT 336 
Ala Thr Ser Lys Phe Val Ser Leu Leu Phe Gly Tyr Ser Lys Asn Ser 
190 195 200 

TTG AGG GAT CGC AAG GAT CAA CTA ATG CAG TAT TGC GAT GTG AGT TTC 384 
Leu Arg Asp Arg Lys Asp Gin Leu Met Gin Tyr Cys Asp Val Ser Phe 
205 210 215 

CAA ACC CAA GCA ATG AGA ATG TTC AAT GAA AAT ATC AGA CAA TTC GTA 432 
Gin Thr Gin Ala Met Arg Met Phe Asn Glu Asn He Arg Gin Phe Val 
220 225 230 235 

GAT AAA GTC CGA GCA GAA GCT ATC ATT AGC TCT AAC ATA CAA AGA GAA 480 
Asp Lys Val Arg Ala Glu Ala He He Ser Ser Asn He Gin Arg Glu 
240 245 250 

AAA GTC AAA AAT AGT CCC TTA ACG AGA TTA ACA TTT TTC ATT ACC ATC 528 
Lys Val Lys Asn Ser Pro Leu Thr Arg Leu Thr Phe Phe He Thr He 
255 260 265 

AAA ATC ACA CCT GAT ACA ATG GAA AAT TAT GAA TAT ATC ACT AAA AAA 576 
Lys He Thr Pro Asp Thr Met Glu Asn Tyr Glu Tyr He Thr Lys Lys 
270 275 280 

CAA GTA ACT ATT TAT TAT GAT TTT GCT AGA GGT AAC TCT TCT CAA GAA 624 
Gin Val Thr He Tyr Tyr Asp Phe Ala Arg Gly Asn Ser Ser Gin Glu 
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285 290 295 



AAT 


CTT 


ATC 


ATC 


AAT 


CCT 


TTT 


GGC 


TTC 


AAA 


GTG 


TTT 


GAC 


ATT 


CAA 


ATC 


Asn 


Leu 


He 


He 


Asn 


Pro 


Phe 


Gly 


Phe 


Lys 


Val 


Phe 


Asp 


He 


Gin 


He 


300 










305 










310 










315 


ACA 


GAT 


TTA 


CAA 


AAC 


GAA 


CAG 


ACG 


GTA 


AGC 


GAA 


ATT 


TTG 


AGA 


AAG 


ATC 


Thr 


Asp 


Leu 


Gin 


Asn 


Glu 


Gin 


Thr 


Val 


Ser 


Glu 


lie 


Leu Arg 


Lys 


He 








320 










325 










330 




AGA 


GAA 


GTG 


GAA 


TCA 


AAA 


AAT 


AAG 


GCA 


TTA 


AAT 


AAA 


TAA 








Arg 


Glu 


Val 


Glu 


Ser 


Lys 


Asn 


Lys 


Ala 


Leu 


Asn 


Lys 


* 














335 








340 

















(2) ANGABEN ZU SEQ ID NO: 108: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 253 Aminosauren 

( B ) ART : Aminos aure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 108: 

Met Leu Gly Lys Lys Asn Glu Glu Val Leu He Asp Glu Asn Leu Val 
1 5 10 15 

Gly Gly Val He Ala Leu Asp Arg Leu Ala Lys Leu Asn Lys Ala Asn 
20 25 30 

Arg Thr Phe Lys Arg Ala Phe Tyr Leu Ser Met Ala Leu Asn Val Ala 
35 40 45 

Ala Val Thr Ser He Val Met Met Met Pro Leu Lys Lys Thr Asp He 
50 55 60 

Phe Val Tyr Gly He Asp Arg Tyr Thr Gly Glu Phe Lys He Val Lys 
65 70 75 80 

Arg Ser Asp Ala Arg Gin He Val Asn Ser Glu Ala Val Val Asp Ser 

85 90 95 

Ala Thr Ser Lys Phe Val Ser Leu Leu Phe Gly Tyr Ser Lys Asn Ser 
100 105 110 

Leu Arg Asp Arg Lys Asp Gin Leu Met Gin Tyr Cys Asp Val Ser Phe 
115 120 125 

Gin Thr Gin Ala Met Arg Met Phe Asn Glu Asn He Arg Gin Phe Val 
130 135 140 

Asp Lys Val Arg Ala Glu Ala He He Ser Ser Asn He Gin Arg Glu 
145 150 155 160 

Lys Val Lys Asn Ser Pro Leu Thr Arg Leu Thr Phe Phe He Thr He 
165 170 175 

Lys He Thr Pro Asp Thr Met Glu Asn Tyr Glu Tyr He Thr Lys Lys 
180 185 190 

Gin Val Thr He Tyr Tyr Asp Phe Ala Arg Gly Asn Ser Ser Gin Glu 



672 



720 



759 
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195 200 205 

Asn Leu lie He Asn Pro Phe Gly Phe Lys Val Phe Asp He Gin He 
210 215 220 

Thr Asp Leu Gin Asn Glu Gin Thr Val Ser Glu He Leu Arg Lys He 
225 230 235 240 

Arg Glu Val Glu Ser Lys Asn Lys Ala Leu Asn Lys * 
245 250 

(2) ANGABEN ZU SEQ ID NO: 109: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 1245 Basenpaare 

(B) ART: Nucleotid 

<C) STRANG FORM : beides 
(D) TOPOLOGIE: linear 



(vii) UNM I TTE LB ARE HERKUNFT: 
(B) CLON(E) : HPS187 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE:1..1245 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 109: 

ATG GAG AAA GGA GTT TGG AAT ATG CTT GAC ATA TGG ATA GAT ATG ATA 48 
Met Glu Lys Gly Val Trp Asn Met Leu Asp He Trp He Asp Met He 
255 260 265 

ATT TGT ATT TTT TAT TTG CTC TTT TTT ACG ACT CCT TAC ATT GTA GGC 96 
He Cys He Phe Tyr Leu Leu Phe Phe Thr Thr Pro Tyr He Val Gly 
270 275 280 285 

GAT ATT TTG CAA TTG AAA TTT ATC CGC CAA AAG CTC TGC GAA AAA CCT 144 
Asp lie Leu Gin Leu Lys Phe He Arg Gin Lys Leu Cys Glu Lys Pro 
290 295 300 

GTT TTA CTC CCA CAA AAG GAT TAT GAA GAA GCG GGA AAT TAT GCC ATT 192 
Val Leu Leu Pro Gin Lys Asp Tyr Glu Glu Ala Gly Asn Tyr Ala He 
305 310 315 

AGG AAA ATG CAA TTA TCC ATT ATT TCT CAA ATT TTA GAC GGG ATA ATC 240 
Arg Lys Met Gin Leu Ser He He Ser Gin He Leu Asp Gly He He 
320 325 330 

TTT GCT GGG TGG GTC TTT TTT GGT TTG ACG CAT TTA GAA GAT CTC ACG 2 88 

Phe Ala Gly Trp Val Phe Phe Gly Leu Thr His Leu Glu Asp Leu Thr 
335 340 345 

CAT TAT TTA AAC CTT CCT GAA ACG CTA GGT TAC TTG GTG TTT GCC TTG 336 
His Tyr Leu Asn Leu Pro Glu Thr Leu Gly Tyr Leu Val Phe Ala Leu 
350 355 360 365 

TTG TTT TTA GCG ATT CAA AGC GTT TTA GCT TTA CCC ATT AGC TAC TAC 384 
Leu Phe Leu Ala He Gin Ser Val Leu Ala Leu Pro He Ser Tyr Tyr 
370 375 380 
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ACC ACG ATG CAT TTG GAT AAG GAA TTT GGC TTT TCT AAG GTG AGC TTG 432 

Thr Thr Met His Leu Asp Lys Glu Phe Gly Phe Ser Lys Val Ser Leu 
385 390 395 

TCG TTG TTT TTT AAG GAT TTT TTC AAA GGG TTA TCG CTC ACT TTA AGC 480 
Ser Leu Phe Phe Lys Asp Phe Phe Lys Gly Leu Ser Leu Thr Leu Ser 
400 405 410 

GTG GGG TTG TTG TTG ATT TAC ACT CTC ATT ATG ATC ATT GAA CAT GTG 528 
Val Gly Leu Leu Leu lie Tyr Thr Leu lie Met lie lie Glu His Val 
415 420 425 

GAA CAT TGG GAG ATT AGC TCG TTT TTT GTC GTG TTT GTT TTT ATG ATC 576 
Glu His Trp Glu He Ser Ser Phe Phe Val Val Phe Val Phe Met He 
430 435 440 445 

TTG GCT AAT CTT TTT TAC CCT AAA ATC GCT CAG CTT TTC AAC CAA TTC 624 
Leu Ala Asn Leu Phe Tyr Pro Lys He Ala Gin Leu Phe Asn Gin Phe 
450 455 460 

ACC CCC TTG AAC AAT AGG GAT TTA GAG AGT CAA ATT GAG GGC ATG ATG 672 
Thr Pro Leu Asn Asn Arg Asp Leu Glu Ser Gin He Glu Gly Met Met 
465 470 475 

GAT AAG GTG GGT TTT AAA TCT GAA GGT ATC TTT GTG ATG GAC GCT AGC 720 
Asp Lys Val Gly Phe Lys Ser Glu Gly He Phe Val Met Asp Ala Ser 
480 485 490 

AAG AGG GAC GGG CGT TTG AAC GCG TAT TTT GGA GGC TTG GGT AAA AAC 768 
Lys Arg Asp Gly Arg Leu Asn Ala Tyr Phe Gly Gly Leu Gly Lys Asn 
495 500 505 

AAG CGG GTG GTG TTG TTT GAC ACT TTG ATC TCT AAA GTT GGG ACA GAA 816 
Lys Arg Val Val Leu Phe Asp Thr Leu He Ser Lys Val Gly Thr Glu 
510 515 520 525 

GGG CTT TTA GCC ATT TTA . GGG CAT GAA TTA GGG CAT TTT AAA AAT AAG 864 
Gly Leu Leu Ala He Leu Gly His Glu Leu Gly His Phe Lys Asn Lys 
530 535 540 

GAT TTG TTG AAA AGT TTA GGG ATT ATG GGA GGC TTA CTC GCT CTT GTT 912 
Asp Leu Leu Lys Ser Leu Gly He Met Gly Gly Leu Leu Ala Leu Val 
545 550 555 

TTT GCT CTG ATC GCT CAT TTG CCG CCG TTG GTT TTT GAA GGC TTC AAT 960 
Phe Ala Leu He Ala His Leu Pro Pro Leu Val Phe Glu Gly Phe Asn 
560 565 570 

GTC TCA CAA ACG CCA GCG AGT TTG ATT GCG ATT TTA CTC TTG TTT TTG 1008 
Val Ser Gin Thr Pro Ala Ser Leu He Ala He Leu Leu Leu Phe Leu 
575 580 585 

CCG GTA TTT TCT TTT TAC GCT ATG CCT TTG ATC GGG TTT TTT AGC CGA 1056 
Pro Val Phe Ser Phe Tyr Ala Met Pro Leu He Gly Phe Phe Ser Arg 
590 595 600 605 

AAG AAT GAA TAC AAT GCA GAC AAG TTT GGG GCG AGT TTA AGC TCT AAA 1104 
Lys Asn Glu Tyr Asn Ala Asp Lys Phe Gly Ala Ser Leu Ser Ser Lys 
610 615 620 

GAG GTT TTA GCC AAA GCG TTA GTG TCT ATT GTG AGT GAG AAT AAA GCG 1152 
Glu Val Leu Ala Lys Ala Leu Val Ser He Val Ser Glu Asn Lys Ala 
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625 630 635 

TTC CCC TAT TCG CAC CCT TTT TAT GTT TTC TTG CAT TTC ACG CAC CCG 12 00 

Phe Pro Tyr Ser His Pro Phe Tyr Val Phe Leu His Phe Thr His Pro 
640 645 650 

CCC TTA TTA GAG CGC TTG AAA GCT TTG GAT TAT GAA ATT GAA TGA 1245 
Pro Leu Leu Glu Arg Leu Lys Ala Leu Asp Tyr Glu lie Glu * 
655 660 665 



(2) ANGABEN ZU SEQ ID NO: 110: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 415 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(3ci) SEQUENZBESCHREIBUNG: SEQ ID NO: 110: 

Met Glu Lys Gly Val Trp Asn Met Leu Asp lie Trp lie Asp Met lie 
15 10 15 

lie Cys lie Phe Tyr Leu Leu Phe Phe Thr Thr Pro Tyr lie Val Gly 
20 25 30 

Asp lie Leu Gin Leu Lys Phe lie Arg Gin Lys Leu Cys Glu Lys Pro 
35 40 45 

Val Leu Leu Pro Gin Lys Asp Tyr Glu Glu Ala Gly Asn Tyr Ala lie 
50 55 60 

Arg Lys Met Gin Leu Ser lie lie Ser Gin He Leu Asp Gly He He 
65 70 75 80 

Phe Ala Gly Trp Val Phe Phe Gly Leu Thr His Leu Glu Asp Leu Thr 

85 90 95 

His Tyr Leu Asn Leu Pro Glu Thr Leu Gly Tyr Leu Val Phe Ala Leu 
100 105 110 

Leu Phe Leu Ala He Gin Ser Val Leu Ala Leu Pro He Ser Tyr Tyr 
115 120 125 

Thr Thr Met His Leu Asp Lys Glu Phe Gly Phe Ser Lys Val Ser Leu 
130 135 140 

Ser Leu Phe Phe Lys Asp Phe Phe Lys Gly Leu Ser Leu Thr Leu Ser 
145 150 155 160 

Val Gly Leu Leu Leu He Tvr Thr Leu He Met He He Glu His Val 
165 * 170 175 

Glu His Trp Glu He Ser Ser Phe Phe Val Val Phe Val Phe Met He 
180 185 190 

Leu Ala Asn Leu Phe Tyr Pro Lys He Ala Gin Leu Phe Asn Gin Phe 
195 200 205 

Thr Pro Leu Asn Asn Arg Asp Leu Glu Ser Gin He Glu Gly Met Met 
210 215 220 
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Asp Lys Val Gly Phe Lys Ser Glu Gly lie Phe Val Met Asp Ala Ser 
225 230 235 240 

Lys Arg Asp Gly Arg Leu Asn Ala Tyr Phe Gly Gly Leu Gly Lys Asn 
245 250 255 

Lys Arg Val Val Leu Phe Asp Thr Leu lie Ser Lys Val Gly Thr Glu 
260 265 270 

Gly Leu Leu Ala lie Leu Gly His Glu Leu Gly His Phe Lys Asn Lys 
275 280 285 

Asp Leu Leu Lys Ser Leu Gly lie Met Gly Gly Leu Leu Ala Leu Val 
290 * 295 300 

Phe Ala Leu lie Ala His Leu Pro Pro Leu Val Phe Glu Gly Phe Asn 
305 310 315 320 

Val Ser Gin Thr Pro Ala Ser Leu lie Ala lie Leu Leu Leu Phe Leu 
325 330 335 

Pro Val Phe Ser Phe Tyr Ala Met Pro Leu He Gly Phe Phe Ser Arg 
340 345 350 

Lys Asn Glu Tyr Asn Ala Asp Lys Phe Gly Ala Ser Leu Ser Ser Lys 
355 360 365 

Glu Val Leu Ala Lys Ala Leu Val Ser He Val Ser Glu Asn Lys Ala 
370 375 380 

Phe Pro Tyr Ser His Pro Phe Tyr Val Phe Leu His Phe Thr His Pro 
385 390 395 400 

Pro Leu Leu Glu Arg Leu Lys Ala Leu Asp Tyr Glu He Glu * 
405 410 415 

(2) ANGABEN ZU SEQ ID NO: 111: 

(i) SEQUENZKENNZEICHEN :. 

(A) LANGE: 1566 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: be ides 
<D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT: 
(B) CLON(E) : HPS189 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE:1..1566 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 111: 

ATG AAA AAC ATT TAT CTT GAT GTG AAA GCC AGC ATT GAA AAT CTC CAA 48 
Met Lys Asn He Tyr Leu Asp Val Lys Ala Ser He Glu Asn Leu Gin 
420 425 430 

AAT ATT TTT AAA AAC ACT GAT AAT GAA AAT GAA AGA CTA AAA AAA TTC 96 
Asn He Phe Lys Asn Thr Asp Asn Glu Asn Glu Arg Leu Lys Lys Phe 
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435 440 445 

AAC CAA GAA GCG TTG GAG GTG TTT CAA AAA TTA GAG CGT GAA AGT TTA 144 
Asn Gin Glu Ala Leu Glu Val Phe Gin Lys Leu Glu Arg Glu Ser Leu 
450 455 460 

AAA GAG CTT GAA AGC TTA AAA AAT AAT GAG GAG TGG GAA AAT TTT ACT 192 
Lys Glu Leu Glu Ser Leu Lys Asn Asn Glu Glu Trp Glu Asn Phe Thr 
465 470 475 

ATC GCT TTT TAT GGG GAA ACC GGT GCG GGG AAA TCA ACC TTC ATT GAA 240 
lie Ala Phe Tyr Gly Glu Thr Gly Ala Gly Lys Ser Thr Phe lie Glu 
480 485 490 495 

TGT TTG AGA ATG TTT TTT AAA GAA CAA AGT AAA GTA GTT CAA CAA GAA 288 
Cys Leu Arg Met Phe Phe Lys Glu Gin Ser Lys Val Val Gin Gin Glu 
500 505 510 

CGA TTC AAG CGG CTT TAT TCC AAT TAC CAA AAC AAC TAT CAA AAT GAT 336 
Arg Phe Lys Arg Leu Tyr Ser Asn Tyr Gin Asn Asn Tyr Gin Asn Asp 
515 520 525 

GAA TGC AAA AAG CAA GCT ATT TTA AAC GAA CTT CAT TCA TTG CAA GAT 3 84 

Glu Cys Lys Lys Gin Ala lie Leu Asn Glu Leu His Ser Leu Gin Asp 
530 535 540 

GGA GCG ATC ATA GGC GAT GGG AGG AGC GAT TTC ACT TTA AAA ACA CGA 432 
Gly Ala lie lie Gly Asp Gly Arg Ser Asp Phe Thr Leu Lys Thr Arg 
545 550 555 

TCT TAT TCT TTC CAA TAC AAC CAT CAA AAC TTT ACT TTG CTT GAT GTT 4 80 

Ser Tyr Ser Phe Gin Tyr Asn His Gin Asn Phe Thr Leu Leu Asp Val 
560 565 570 575 

CCA GGG ATA GAA GGC GAC GAA AAA AAA GTG ATC GAT CAG ATT TCT AAC 528 
Pro Gly lie Glu Gly Asp Glu Lys Lys Val lie Asp Gin lie Ser Asn 
580 585 590 

GCA ACG CAA AAA GCC CAT GCT ATT TTT TAT GTT ACC AAA ACG CCT AAT 576 
Ala Thr Gin Lys Ala His Ala lie Phe Tyr Val Thr Lys Thr Pro Asn 
595 600 605 

CCT CCG CAA AAA GGA GAA GAG AAA AAA GAA GGG ACG ATT GAA AAA ATC 624 
Pro Pro Gin Lys Gly Glu Glu Lys Lys Glu Gly Thr lie Glu Lys lie 
610 615 620 

CAA AAA CAA CTT GAT TCG CAA ACA GAG GTA TGG ACG ATT TTT AAC AAA 672 
Gin Lys Gin Leu Asp Ser Gin Thr Glu Val Trp Thr He Phe Asn Lys 
625 630 635 

CCG ATT AAC AAC CCA AGA GCT TTC AAA GAT GGG CTT ATT GAT GGA AGC 72 0 

Pro He Asn Asn Pro Arg Ala Phe Lys Asp Gly Leu He Asp Gly Ser 
640 645 650 655 

GAA AAA GAA AGC TTA AAA ATT TTA AAT AAA GAA ATG AAA AAC ATT TTA 768 
Glu Lys Glu Ser Leu Lys He Leu Asn Lys Glu Met Lys Asn He Leu 
660 665 670 

GGC AAA CAC TAC AAG GGC TAT AAA GCA GTG AGC GCC CAA GTG GCT TTT 816 
Gly Lys His Tyr Lys Gly Tyr Lys Ala Val Ser Ala Gin Val Ala Phe 
675 680 685 
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TAT GGT CTT TCA TCG GCT TTG ATC CCA GGG ACT GAT TTT GAT AAA AAC 864 
Tyr Gly Leu Ser Ser Ala Leu lie Pro Gly Thr Asp Phe Asp Lys Asn 
690 695 700 

AAA CAA AAA TTT TTA AAA GAT TTT AAA GCA AGA GAA TTA TTG TAT CAA 912 
Lys Gin Lys Phe Leu Lys Asp Phe Lys Ala Arg Glu Leu Leu Tyr Gin 
705 710 715 

TCC CAT TTC CAA CAA TTA GGA GAA TTT ATA GCC GAA GAG CTT ATT AAA 960 
Ser His Phe Gin Gin Leu Gly Glu Phe lie Ala Glu Glu Leu lie Lys 
720 725 730 735 

AAC TCG CGT GCC AAA ATC ATT CAA TCA AAC TGC AAT AAA GCC TTA AAA 1008 
Asn Ser Arg Ala Lys lie lie Gin Ser Asn Cys Asn Lys Ala Leu Lys 
740 745 750 

GTG GTA GAA CAA TTG CAA AAG GCG ATC GAA ATT ACG ATT GAA AAA CGG 1056 
Val Val Glu Gin Leu Gin Lys Ala He Glu He Thr He Glu Lys Arg 
755 760 765 

ATC GAT CCA ATG ATT AAA GAA GCA CAA GAA TAC CAA CAC GAA GCC CGC 1104 
He Asp Pro Met He Lys Glu Ala Gin Glu Tyr Gin His Glu Ala Arg 
770 775 780 

TAT AAT CTG GAT CGT TCT ACA GAT AAA TTT ATA TTA AAT TTA ACC AAT 1152 
Tyr Asn Leu Asp Arg Ser Thr Asp Lys Phe He Leu Asn Leu Thr Asn 
785 790 795 

TCA GCG TTC TAC GAA ATC GAT CAA TTC AAA TCT GAC TTG AGA GAA AAA 1200 
Ser Ala Phe Tyr Glu He Asp Gin Phe Lys Ser Asp Leu Arg Glu Lys 
800 805 810 815 

ATG TAT GCG CAT ATT AAC AAA AAT ATT GAA GAT GAG GAA TGT AAA GAA 1248 
Met Tyr Ala His He Asn Lys Asn lie Glu Asp Glu Glu Cys Lys Glu 
820 825 830 

ATT TTT AAA AAT GAA CTC ATT CAA GGA ATT GAA ACA TTG CAT GAA GAC 1296 
He Phe Lys Asn Glu Leu He Gin Gly He Glu Thr Leu His Glu Asp 
835 840. 845 

ATA AAA TGG CGG TTT AGA GAA TGT GAG AAA CGA TTT GAT GGA GAG ATA 1344 
He Lys Trp Arg Phe Arg Glu Cys Glu Lys Arg Phe Asp Gly Glu He 
850 855 860 

AAA GAA GCT ATT AAA CAA CTT GAA TAC AGA ATT AAA GAT TCT CTA GCA 1392 
Lys Glu Ala He Lys Gin Leu Glu Tyr Arg He Lys Asp Ser Leu Ala 
865 870 875 

ATG TTA GAG CGC ATC AGT ATT GAT AGA GAC TTT AAT CTT AAT TTT GAT 1440 
Met Leu Glu Arg He Ser He Asp Arg Asp Phe Asn Leu Asn Phe Asp 
880 885 890 895 

ACT GAT AGC GGT ATT GAT GGA ACA AAA TTA GCC ACT TCA ATA GGA GGT 1488 
Thr Asp Ser Gly He Asp Gly Thr Lys Leu Ala Thr Ser He Gly Gly 
900 905 910 

TTG GGT TTG CTT GGG ATA TTT AAC GCT TGG AAT CCT ATG GGT TGG CTT 1536 
Leu Gly Leu Leu Gly He Phe Asn Ala Trp Asn Pro Met Gly Trp Leu 
915 920 925 

GCT CTG ACC GCA GGA TTA TTG CAG GAT TAG 1566 
Ala Leu Thr Ala Gly Leu Leu Gin Asp * 
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177 



935 



(2) ANGABEN ZU SEQ ID NO: 112: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 522 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKXJLS : Protein 

<xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 112: 

Met Lys Asn lie Tyr Leu Asp Val Lys Ala Ser lie Glu Asn Leu Gin 
15 10 15 

Asn lie Phe Lys Asn Thr Asp Asn Glu Asn Glu Arg Leu Lys Lys Phe 
20 25 30 

Asn Gin Glu Ala Leu Glu Val Phe Gin Lys Leu Glu Arg Glu Ser Leu 
35 40 45 

Lys Glu Leu Glu Ser Leu Lys Asn Asn Glu Glu Trp Glu Asn Phe Thr 
50 55 60 

lie Ala Phe Tyr Gly Glu Thr Gly Ala Gly Lys Ser Thr Phe lie Glu 
65 70 75 80 

Cys Leu Arg Met Phe Phe Lys Glu Gin Ser Lys Val Val Gin Gin Glu 
85 90 95 

Arg Phe Lys Arg Leu Tyr Ser Asn Tyr Gin Asn Asn Tyr Gin Asn Asp 
100 105 110 

Glu Cys Lys Lys Gin Ala lie Leu Asn Glu Leu His Ser Leu Gin Asp 
115 120 125 

Gly Ala lie lie Gly Asp Gly Arg Ser Asp Phe Thr Leu Lys Thr Arg 
130 135 140 

Ser Tyr Ser Phe Gin Tyr Asn His Gin Asn Phe Thr Leu Leu Asp Val 
145 150 155 160 

Pro Gly lie Glu Gly Asp Glu Lys Lys Val lie Asp Gin lie Ser Asn 
165 170 175 

Ala Thr Gin Lys Ala His Ala He Phe Tyr Val Thr Lys Thr Pro Asn 
180 185 190 

Pro Pro Gin Lys Gly Glu Glu Lys Lys Glu Gly Thr He Glu Lys He 
195 200 205 

Gin Lys Gin Leu Asp Ser Gin Thr Glu Val Trp Thr He Phe Asn Lys 
210 215 220 

Pro He Asn Asn Pro Arg Ala Phe Lys Asp Gly Leu He Asp Gly Ser 
225 230 235 240 

Glu Lys Glu Ser Leu Lys He Leu Asn Lys Glu Met Lys Asn He Leu 
245 250 255 

Gly Lys His Tyr Lys Gly Tyr Lys Ala Val Ser Ala Gin Val Ala Phe 
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260 265 270 

Tyr Gly Leu Ser Ser Ala Leu lie Pro Gly Thr Asp Phe Asp Lys Asn 
275 280 285 

Lys Gin Lys Phe Leu Lys Asp Phe Lys Ala Arg Glu Leu Leu Tyr Gin 
290 295 300 

Ser His Phe Gin Gin Leu Gly Glu Phe lie Ala Glu Glu Leu lie Lys 
305 310 315 320 

Asn Ser Arg Ala Lys lie He Gin Ser Asn Cys Asn Lys Ala Leu Lys 
325 330 335 

Val Val Glu Gin Leu Gin Lys Ala He Glu He Thr He Glu Lys Arg 
340 345 350 

He Asp Pro Met He Lys Glu Ala Gin Glu Tyr Gin His Glu Ala Arg 
355 360 365 

Tyr Asn Leu Asp Arg Ser Thr Asp Lys Phe He Leu Asn Leu Thr Asn 
370 375 380 

Ser Ala Phe Tyr Glu He Asp Gin Phe Lys Ser Asp Leu Arg Glu Lys 
385 390 395 400 

Met Tyr Ala His He Asn Lys Asn He Glu Asp Glu Glu Cys Lys Glu 
405 410 415 

He Phe Lys Asn Glu Leu He Gin Gly He Glu Thr Leu His Glu Asp 
420 425 430 

He Lys Trp Arg Phe Arg Glu Cys Glu Lys Arg Phe Asp Gly Glu He 
435 440 445 

Lys Glu Ala He Lys Gin Leu Glu Tyr Arg He Lys Asp Ser Leu Ala 
450 455 460 

Met Leu Glu Arg He Ser He Asp Arg . Asp Phe Asn Leu Asn Phe Asp 
465 470 475 480 

Thr Asp Ser Gly He Asp Gly Thr Lys Leu Ala Thr Ser He Gly Gly 
485 490 495 

Leu Gly Leu Leu Gly He Phe Asn Ala Trp Asn Pro Met Gly Trp Leu 
500 505 510 

Ala Leu Thr Ala Gly Leu Leu Gin Asp * 
515 520 

(2) ANGABEN ZU SEQ ID NO: 113: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 1782 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT: 
(B) CLON(E) : HPS191 
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(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE:1..1782 

(xi) SEQUENZBESCHREIBUNG : SEQ ID NO: 113: 

ATG AAA GCT ATA AAA ATA CTT TTT ATA ATG ACA CTC AGT TTA AAC GCT 4 8 

Met Lys Ala lie Lys He Leu Phe He Met Thr Leu Ser Leu Asn Ala 
525 530 535 

ATC AGC GTG AAT AGG GCG TTG TTT GAT TTA AAA GAT TCG CAA TTA AAA 96 
He Ser Val Asn Arg Ala Leu Phe Asp Leu Lys Asp Ser Gin Leu Lys 
540 545 550 

GGG GAA TTA ACG CCA AAA ATA GTG AAT TTT GGG GGT TAT AAA AGC AGC 144 
Gly Glu Leu Thr Pro Lys He Val Asn Phe Gly Gly Tyr Lys Ser Ser 
555 560 565 570 

ACT GAA GAG TGG GGG GCT ACG GCT TTA AAC TAT ATC AAT GCG GCT AAT 192 
Thr Glu Glu Trp Gly Ala Thr Ala Leu Asn Tyr He Asn Ala Ala Asn 
575 580 585 

GGC GAT GCG AAA AAA TTC AGC ACT CTA GTG GAA AAA ATG CGT TTT AAC 24 0 

Gly Asp Ala Lys Lys Phe Ser Thr Leu Val Glu Lys Met Arg Phe Asn 
590 595 600 

TCC GGT ATA TTG GGG AAT TTA AGA GTG CAT GCA CGT TTG AGG CAA GCC 288 
Ser Gly He Leu Gly Asn Leu Arg Val His Ala Arg Leu Arg Gin Ala 
605 610 615 

CTA AAA TTG CAA AAG AAT TTG AAA TAT TGC CTT AAA ATC ATC GCT AGG 336 
Leu Lys Leu Gin Lys Asn Leu Lys Tyr Cys Leu Lys He He Ala Arg 
620 625 630 

GAT TCT TTT TAT AGC TAC CGC ACC GGT ATT TAT ATC CCC TTA GGC ATT 384 
Asp Ser Phe Tyr Ser Tyr Arg Thr Gly He Tyr He Pro Leu Gly He 
635 640 645 650 

TCT TTA AAA GAT CAA AAA ACG GCT CAA AAA ATG CTC GCT GAT TTG AGC 432 
Ser Leu Lys Asp Gin Lys Thr Ala Gin Lys Met Leu Ala Asp Leu Ser 
655 660 665 

GTG GTA GGG GCG TAT CTT AAA AAA CAA CAA GAG AAT GAA AAG GCT CAA 480 
Val Val Gly Ala Tyr Leu Lys Lys Gin Gin Glu Asn Glu Lys Ala Gin 
670 675 680 

AGC CCT TAT TAC AGA AAC AAC AAC TAT TAC AAC TCT TAC TAT AGC CCT 528 
Ser Pro Tyr Tyr Arg Asn Asn Asn Tyr Tyr Asn Ser Tyr Tyr Ser Pro 
685 690 695 

TAT TAC GGA ATG TAT GGT ATG TAT GGC ATG GGC ATG TAT GGA ATG TAT 576 
Tyr Tyr Gly Met Tyr Gly Met Tyr Gly Met Gly Met Tyr Gly Met Tyr 
700 705 710 

GGC ATG GGC ATG TAT GAT TTT TAT GAC TTT TAT GAT GGC ATG TAT GGA 624 
Gly Met Gly Met Tyr Asp Phe Tyr Asp Phe Tyr Asp Gly Met Tyr Gly 
715 720 725 730 

TTC TAC CCT AAC ATG TTT TTC ATG ATG CAA GTT CAA GAT TAC TTG ATG 672 
Phe Tyr Pro Asn Met Phe Phe Met Met Gin Val Gin Asp Tyr Leu Met 
735 740 745 
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TTA GAA AAT TAC ATG TAT GCG CTC GAT CAA GAA GAG ATT TTA GAT CAT 720 

Leu Glu Asn Tyr Met Tyr Ala Leu Asp Gin Glu Glu He Leu Asp His 

750 755 760 

GAC GCT TCT ACT GAC CAA CTT GAT ACG CCT ACT GAT GAT GAC AAA GAC 768 
Asp Ala Ser Thr Asp Gin Leu Asp Thr Pro Thr Asp Asp Asp Lys Asp 
765 770 775 

GAT AAA GAC GAT AAA TCC TTA CAG CAG GCA AAT CTT ATG AAC TTT TAT 816 
Asp Lys Asp Asp Lys Ser Leu Gin Gin Ala Asn Leu Met Asn Phe Tyr 
780 785 790 

CGT GAT CCC AAA TTC AGC AAA GGC ATT CAA ACC AAC CGC TTG AAT AGC 864 
Arg Asp Pro Lys Phe Ser Lys Gly He Gin Thr Asn Arg Leu Asn Ser 
795 800 805 810 

GCT TTA GTC AAT TTA GAC AAC AGT CGC ATG CTC AAA GAC AAT TCG CTT 912 
Ala Leu Val Asn Leu Asp Asn Ser Arg Met Leu Lys Asp Asn Ser Leu 
815 820 825 

TTC CAC ACT AAA GCC ATG CCC ACT AAA AGC GTG GAT GCG ATA ACT TCT 960 
Phe His Thr Lys Ala Met Pro Thr Lys Ser Val Asp Ala He Thr Ser 
830 835 840 

CAA GCC AAA GAG CTT AAC CAT TTA GTG GGG CAA ATC AAA GAA ATG AAG 1008 
Gin Ala Lys Glu Leu Asn His Leu Val Gly Gin He Lys Glu Met Lys 
845 850 855 

CAA GAC GGG GCG AGT CCT AGT AAG ATT GAT TCA GTT GTC AAT AAA GCT 1056 
Gin Asp Gly Ala Ser Pro Ser Lys He Asp Ser Val Val Asn Lys Ala 
860 865 870 

ATG GAA GTG AGG GAC AAG CTA GAC AAT AAT CTC AAC CAA CTA GAC AAT 1104 
Met Glu Val Arg Asp Lys Leu Asp Asn Asn Leu Asn Gin Leu Asp Asn 
875 880 885 890 

GAC TTA AAA GAT CAA AAA GGG CTT TCA AGC GAG CAA CAA GCT CAA GTG 1152 
Asp Leu Lys Asp Gin Lys Gly Leu Ser Ser Glu Gin Gin Ala Gin Val 
895 900 905 

GAT AAA GCC CTA GAC AGC GTG CAA CAA TTA AGC CAT AGC AGC GAT GTG 1200 
Asp Lys Ala Leu Asp Ser Val Gin Gin Leu Ser His Ser Ser Asp Val 
910 915 920 

GTG GGG AAT TAT TTA GAC GGG AGT TTG AAA ATT GAT GGC GAT GAT AGA 1248 
Val Gly Asn Tyr Leu Asp Gly Ser Leu Lys He Asp Gly Asp Asp Arg 
925 930 935 

GAT GAT TTG AAT GAT GCG ATG AAT AAC CCT ATG CAA CAA CCC GTG CAA 1296 
Asp Asp Leu Asn Asp Ala Met Asn Asn Pro Met Gin Gin Pro Val Gin 
940 945 950 

CAA ACG CCT ACT AGC AAC ATG GCC GAC ACC CAT GCA AAT GAC AGC AAG 1344 
Gin Thr Pro Thr Ser Asn Met Ala Asp Thr His Ala Asn Asp Ser Lys 
955 960 965 970 

GAT CAA GGG AGT AAC GCG CTC ATA AAC CCT AAC AGC GCC ACT AAC GCC 1392 
Asp Gin Gly Ser Asn Ala Leu He Asn Pro Asn Ser Ala Thr Asn Ala 
975 980 985 

GAC GAC ACT CAC ACT GAC GAT ACT CAC ACT GAC ACT AAC ACC ACA AAC 1440 
Asp Asp Thr His Thr Asp Asp Thr His Thr Asp Thr Asn Thr Thr Asn 
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990 995 1000 

GAT GCT AGC ACC ACT GAC ACC CCC ACT GAC GAT AAA GAT GCT AGC GGC 1488 
Asp Ala Ser Thr Thr Asp Thr Pro Thr Asp Asp Lys Asp Ala Ser Gly 
1005 1010 1015 

TTG AAC AAT ACC GGC GAT ATG AAT AAC ACG GAT ACC GGC AAC ACG GAC 1536 
Leu Asn Asn Thr Gly Asp Met Asn Asn Thr Asp Thr Gly Asn Thr Asp 
1020 1025 1030 

ACC GGC AAT ACG GAT ACC GGT AAC ACT GAT GAT ATG AGC AAC ATG AAC 1584 
Thr Gly Asn Thr Asp Thr Gly Asn Thr Asp Asp Met Ser Asn Met Asn 
1035 1040 1045 1050 

AAC GGC AAC GAT GAT ACG GGT AAC GCT AAT GAC GAC ATG AGC AAC GGC 1632 
Asn Gly Asn Asp Asp Thr Gly Asn Ala Asn Asp Asp Met Ser Asn Gly 
1055 1060 1065 

AAC GAC ATG GGC GAT GAT TTG AAC AAC GCG AAC GAT ATG AAC GAC GAC 1680 
Asn Asp Met Gly Asp Asp Leu Asn Asn Ala Asn Asp Met Asn Asp Asp 
1070 1075 1080 

ATG GGT AAT GGC AAC GAT GAC ATG GGC GAT ATG GGG GAT ATG AAC GAC 1728 
Met Gly Asn Gly Asn Asp Asp Met Gly Asp Met Gly Asp Met Asn Asp 
1085 1090 1095 

GAT ATG GGT GGC GAT ATG GGA GAC ATG GGG GAT ATG GGC GAT ATG GGG 1776 
Asp Met Gly Gly Asp Met Gly Asp Met Gly Asp Met Gly Asp Met Gly 
1100 1105 1110 



AAT TGA 
Asn * 
1115 



1782 



(2) ANGABEN ZU SEQ ID NO: 114: 

(i) SEQUENZKENNZEICHEN : 

(A) LANGE: 594 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE : linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG : SEQ ID NO: 114: 

Met Lys Ala lie Lys lie Leu Phe lie Met Thr Leu Ser Leu Asn Ala 
x 5 10 15 

lie Ser Val Asn Arg Ala Leu Phe Asp Leu Lys Asp Ser Gin Leu Lys 
20 25 30 

Gly Glu Leu Thr Pro Lys He Val Asn Phe Gly Gly Tyr Lys Ser Ser 
35 40 45 

Thr Glu Glu Trp Gly Ala Thr Ala Leu Asn Tyr He Asn Ala Ala Asn 
50 55 60 

Gly Asp Ala Lys Lys Phe Ser Thr Leu Val Glu Lys Met Arg Phe Asn 
65 70 75 80 

Ser Gly He Leu Gly Asn Leu Arg Val His Ala Arg Leu Arg Gin Ala 

85 90 95 
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Leu Lys Leu Gin Lys Asn Leu Lys Tyr Cys Leu Lys lie lie Ala Arg 
100 105 110 

Asp Ser Phe Tyr Ser Tyr Arg Thr Gly lie Tyr lie Pro Leu Gly lie 
115 120 125 

Ser Leu Lys Asp Gin Lys Thr Ala Gin Lys Met Leu Ala Asp Leu Ser 
130 135 140 

Val Val Gly Ala Tyr Leu Lys Lys Gin Gin Glu Asn Glu Lys Ala Gin 
145 150 155 160 

Ser Pro Tyr Tyr Arg Asn Asn Asn Tyr Tyr Asn Ser Tyr Tyr Ser Pro 
165 170 175 

Tvr Tyr Gly Met Tyr Gly Met Tyr Gly Met Gly Met Tyr Gly Met Tyr 
180 185 190 

Gly Met Gly Met Tyr Asp Phe Tyr Asp Phe Tyr Asp Gly Met Tyr Gly 
195 200 205 

Phe Tyr Pro Asn Met Phe Phe Met Met Gin Val Gin Asp Tyr Leu Met 
210 215 220 

Leu Glu Asn Tyr Met Tyr Ala Leu Asp Gin Glu Glu lie Leu Asp His 
225 230 235 240 

Asp Ala Ser Thr Asp Gin Leu Asp Thr Pro Thr Asp Asp Asp Lys Asp 
245 250 255 

Asp Lys Asp Asp Lys Ser Leu Gin Gin Ala Asn Leu Met Asn Phe Tyr 
260 265 270 

Arg Asp Pro Lys Phe Ser Lys Gly lie Gin Thr Asn Arg Leu Asn Ser 
275 280 285 

Ala Leu Val Asn Leu Asp Asn Ser Arg Met Leu Lys Asp Asn Ser Leu 
290 295 300 

Phe His Thr Lys Ala Met Pro Thr Lys Ser Val Asp Ala lie Thr Ser 
305 310 315 320 

Gin Ala Lys Glu Leu Asn His Leu Val Gly Gin lie Lys Glu Met Lys 
325 330 335 

Gin Asp Gly Ala Ser Pro Ser Lys lie Asp Ser Val Val Asn Lys Ala 
340 345 350 

Met Glu Val Arg Asp Lys Leu Asp Asn Asn Leu Asn Gin Leu Asp Asn 
355 360 365 

Asp Leu Lys Asp Gin Lys Gly Leu Ser Ser Glu Gin Gin Ala Gin Val 
370 375 380 

Asp Lys Ala Leu Asp Ser Val Gin Gin Leu Ser His Ser Ser Asp Val 
385 390 395 400 

Val Gly Asn Tyr Leu Asp Gly Ser Leu Lys He Asp Gly Asp Asp Arg 
405 410 415 

Asp Asp Leu Asn Asp Ala Met Asn Asn Pro Met Gin Gin Pro Val Gin 
420 425 430 
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Gin Thr Pro Thr Ser Asn Met Ala Asp Thr His Ala Asn Asp Ser Lys 
435 440 445 

Asp Gin Gly Ser Asn Ala Leu lie Asn Pro Asn Ser Ala Thr Asn Ala 
450 455 460 

Asp Asp Thr His Thr Asp Asp Thr His Thr Asp Thr Asn Thr Thr Asn 
465 470 475 480 

Asp Ala Ser Thr Thr Asp Thr Pro Thr Asp Asp Lys Asp Ala Ser Gly 
485 490 495 

Leu Asn Asn. Thr Gly Asp Met Asn Asn Thr Asp Thr Gly Asn Thr Asp 
500 505 510 

Thr Gly Asn Thr Asp Thr Gly Asn Thr Asp Asp Met Ser Asn Met Asn 
515 520 525 

Asn Gly Asn Asp Asp Thr Gly Asn Ala Asn Asp Asp Met Ser Asn Gly 
530 535 540 

Asn Asp Met Gly Asp Asp Leu Asn Asn Ala Asn Asp Met Asn Asp Asp 
545 550 555 560 

Met Gly Asn Gly Asn Asp Asp Met Gly Asp Met Gly Asp Met Asn Asp 
565 570 575 

Asp Met Gly Gly Asp Met Gly Asp Met Gly Asp Met Gly Asp Met Gly 
580 585 590 

Asn * 



